Teradata天睿公司CTO寶立明(Stephen Brobst)
5月22日消息,大資料廠商Teradata天睿公司CTO寶立明(Stephen Brobst)日前在「2013 Teradata大資料峰會」上向騰訊科技表示,不能一味的否定看似無用的資料,它們同樣蘊含著價值, 只是尚未找到價值體現手段,可以用低成本的存儲伺服器加以保留。
資料均有價值
如何區分大資料的價值? 寶立明表示,不能一味地否定無用的資料,它們同樣蘊含著價值,它們確切的說法應該是低價值密度資料。 因此,企業也應該保留這些資料,只是暫時尚未發現它的價值,可以用低成本的存儲伺服器保留它們。
他舉例說,當人們通過搜尋引擎檢索時,會出現一些習慣性的拼寫錯誤。 這些錯誤資料雖然表面上沒有意義,但通過收集這些資料卻可以發現大量的使用者習慣和規律。
他表示,人們對於海量資料感到困惑,這是因為未能全域掌握整個資料只是看到破碎的、零散的、局部的資料。 這就像通常「給資料做提煉總結」而在總結的過程中往往會丟失掉大量細節,但是很多有價值的資訊正隱藏在具體的細節當中。
寶立明建議,對於不同價值的資料要區分對待,把價值不高的資料存儲在低成本的環境當中,但是絕對不會把它丟棄,因為假以時日,它還是會有一定的價值會被挖掘出來。
隱私保護仍待解決
在談到對大資料的隱私恐慌問題時,寶立明認為,應該對使用者隱私提供一定的保護,例如通過資料加密,只讓需要知道資料的人瞭解、接觸或者訪問到這些資料。 他希望大眾瞭解,通常通過資料採礦軟體,實際上看到的使用者資料或者資訊並不針對某個具體的人。
他介紹,很多國家的立法機構或者政府希望通過制定隱私保護法律來實現對使用者資訊的保護。 但是,由於對資料分析不了解,有些法規最終可能限制了使用者對資訊和資料的使用。
例如,在某些國家要求電話的通話記錄最多隻能保持90天,這種通話記錄只能夠用於計費目的,就限制了電信運營商對資料的保存,不能夠很好地來設計符合消費者或者使用者需求的電信產品,同時給定價方式也帶來很大限制,進而影響市場競爭。
(責任編輯:蒙遺善)