來源:互聯網
上載者:User
關鍵字
大資料
大資料
解讀
大資料
解讀
可以
大資料
解讀
可以
大資料技術
大資料
解讀
可以
大資料技術
越來越
「大資料」這一概念最初起源于美國。 這裡的「大」通常用來描述資料的三維特徵:第一維指資訊的資料體量日益龐大;第二維指資訊的種類繁多;第三維指資料變為可用資訊,並且可以分析速度越來越快。
早在1969年,全球零售巨頭沃爾瑪便利用電腦對消費者的購物行為進行資料分析,結果發現男性顧客在購買嬰兒尿布時,常常會順便「搭配」幾瓶啤酒來犒勞自己,於是推出了將啤酒與尿布捆綁銷售的促銷手段。 如今,這一「啤酒+尿布」的資料分析成果,已成為科學家通俗解釋「大資料」技術的經典案例。
「‘大資料’具有多種多樣的定義方式,這一概念最初起源于美國,是由思科、威睿、甲骨文、IBM等公司倡議發展起來的。 這裡的‘大’通常用來描述資料的三維特徵:第一維指資訊的資料體量日益龐大,如今已從TB級升到EB級,又將躍升到zettabytes級;第二維是指資訊的種類繁多;第三維是指資料變為可用資訊,並且可以分析的速度越來越快。 」在接受本報記者採訪時,美國加利福尼亞大學里弗塞德分校計算和通信專家楊鳴博士強調,「最近媒體常常議論的大資料,其實專指大資料的第四維特性,即資料的使用價值,主要體現在資料的智慧分析上。 」
楊鳴說,智慧分析是一種對未來智慧的投資,分析的最終目標是做出更明智的決定。 有些人誤以為大資料只是資料技術處理的升級,即如何存儲和備份擁有的資料,但大資料的真正意義在於用新的方式對資料進行分析,並作出合理解釋。
大資料所涉及的資訊與人密切相關。 與人有關的資訊占世界上所有資料的90%,主要包括電子郵件、視頻檔、社交網路、博客內容、話務中心的對話等等,它正以驚人的速度增長,年複合增長率高達62%。 大資料的應用,將有助於決策人靈活應對現實世界中「資料海嘯」引起的機遇和挑戰。
「人類資訊」將引起資訊技術(IT)的再次進化。 多年來,科技界一直在改變資訊技術(IT)中技術,也就是「T」的含量。 例如,引進大型電腦、用戶端伺服器、網路供應(IP)、雲計算等技術。 大資料技術第一次使資訊,也就是「I」在IT中發生了變化,從傳統的資訊(Information)之「I」向著智慧(Intelligence)之「I」發展。
對人類資訊進行「技術理解」,需要從根本上採取新方法和新技術,以便為人類無時無刻不在增加的資訊提供洞察力、想法和直覺。 未來的資訊計算將以大資料模式,引起人類社會資訊對話模式的根本性轉變,以智慧分析為前提的資訊應用將會以更大規模解讀人類,挖掘人類資訊的價值。
當通過資訊搜尋來揭露犯罪時,破案人員可以從犯罪嫌疑人的電子郵件中尋找證據;當試圖理解客戶群時,行銷人員可以搜尋和分析客戶公開的所有資訊,既可以是研究者自己資料庫所掌握的,也可以是被調查者公開在微博或博客上的資訊。 這一圖景使我們看到,在當今資訊爆炸的社會中,資訊流動和分析正變得越來越複雜。
美國白宮科技政策辦公室在去年3月29日發佈了《大資料研究和發展計畫》,同時組建「大資料高級指導小組」,顯示美國已把應對大資料技術革命帶來的機遇和挑戰提高到國家戰略層面。
去年8月,對1105家美國企業和集團進行的調查顯示,63%的受訪者認為只有實施和使用大資料技術才能完成各自機構的使命,49%的受訪者表示將增加他們的大資料預算,46%的受訪者計畫至少保持他們現有的大資料預算水準。
楊鳴對本報記者表示,對於像中國這樣的發展中國家來說,在高科技領域追趕國際先進水準應該還是比較容易的,應當在大資料研究上加大力度。 主要包括兩個方面,一是在作為大資料技術基礎的雲計算方面,要著力應用開發;二是在資料處理方面,不僅要重視結構性資料(即已經數位化了的資訊),而且要重視在電子郵件、博客等非數位化的人文資料分析。
(責任編輯:蒙遺善)