英特爾人類學家Genevieve Bell分享了她針對大資料(big data)所做的研究,她深刻思考了大資料對未來可能激起的改變,並探討了在許多不同情境下,這些大資料現象實際上所蘊涵的意義。
Bell在HTTP://www.aliyun.com/zixun/aggregation/18652.html">英特爾公司的正式頭銜是英特爾實驗室互動暨體驗研究總監, 她負責的工作與英特爾其他科學家和工程師截然不同,涉及的層面涵蓋了所有最近在業界掀起熱烈討論的資料海嘯(data tsunami)、雲計算、設備擴散(device proliferation),以及更強大的伺服器在內。 「大資料」,正是Bell的下一個主要研究專案。
「問題是該從何處著手? 對於我們想要討論的主題,我們仍處在試著想像這個主題的輪廓及其規模的階段,」Bell在稍早前英特爾的倫敦Xeon E5處理器發佈會上表示。 「而今天,所有已達爆滿邊緣的資料庫,只不過是個開端而已。 」
接下來,Bell表示,這個世界必須去思考,我們想怎樣過濾這些資料? 這會對傳統線上資料庫帶來哪些改變? 既有的資料世界是否會開始失序,甚至面臨崩解而後再建設的局面?
而在這一切的轉變過程中,Bell表示,至少我們已經開始明白,所有的一切都會朝著建立一種資料追蹤法則的方向發展,包括類比和數位資料在內,而且,我們還必須有能力管理所有資料。
「對我來說,在這份工作中,資料本身並不是讓我最感興趣的地方,因為所有的一切事物都會產生資料,真正有趣之處在于如何開發更能善加運用這些資料的演算法之類,」她解釋道。
今天,我們使用資料的方法,並非都能直觀地展現出資料本身的意義,Bell說,特別是演算法──要讓所有的資料都能善加運用,就必須深入瞭解資料本身的正確性,而這又和最初的資料填寫者有著密切關聯。
「所有我們試圖用來讓資料使用更加合理的想法,都會在一開始被就放在最優先的位置,」她說。 事實上,她也點出了當我們開始在單一一種資料模式內找尋資料間的固定模式、因果關係和關聯時,實際上都早已落入固有的偏見之中。
「對我而言,大資料分析最迷人之處不僅在於彙聚了來自各個領域的廣泛資料,更重要的是你可以拿它們來做些什麼,」Bell表示,我們愈來愈依賴資料分析,某種層面來說,這也代表著文化腳本(cultural script)正在跨入嶄新的水準。
這類有關資料分析的想法,也推動資料朝「擬人化」(anthropomorphizing)的方向發展。 Bell指出,在開始討論到「資料的秘密生活」(the secret life of data)之際,所有這些資料都將是必要的。 而這些討論也將進一步推動大資料和雲計算等應用的擴展。
Bell表示,所有的資料實際上都擁有它自己的特性,這正是使它與其他所有資料有所差異化之處,因此,在分析資料以前,最好先厘清所有資料的特性。
(責任編輯:蒙遺善)