在8月31日舉行了百度百家BIG大對話中,IT人類動力實驗室主任,「可穿戴設備之父」,全球七大權威大資料專家之一的阿萊克斯•彭特蘭向與會人士介紹了人工智慧與大資料方面的最近進展和思考,這也引發了社會上對大資料的新一輪關注。
大資料在國內已經形成應用熱潮
最近兩年,大資料概念在中國非常熱,各方面的應用也已經開始推進,最為著名的便是剛剛結束的巴西世界盃比賽的賽事預測。 在其他方面,上海等大城市利用大資料進行智慧交通管理,一些電商網站也利用大資料進行客戶行為和購買預測,提升了精細化行銷的水準。
國內最為重視大資料的公司,以BAT三家互聯網巨頭為最,騰訊有數億社交使用者的交流資訊,阿裡巴巴有億萬網購使用者的交易行為資料,百度掌握了中國互聯網使用者最為集中的搜索行為和流量指向資料,所以, 這些公司都擁有了很好的大資料應用的基礎。
以百度為例,百度的世界盃大資料預測在巴西世界盃期間説明很多人更好的觀看比賽和預測賽果,而百度糯米的「專享座」服務更是創造了大資料趣味應用的經典之作。 當然,央視與百度的合作在春節期間對春運客流的分析讓很多人第一次感受到了大資料的威力,而與聯合國啟動戰略合作共建大資料聯合實驗室更是開創了聯合國開發計畫署的先例。
什麼是大資料?資料獲取能力至關重要
按照百科的解釋,大資料(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為説明企業經營決策更積極目的的資訊。
即便如此,有關大資料,也仍然沒有大家都能普遍接受的統一定義。 可以說,資料量大並非大資料,再大量的資料如果不能被利用也不能被稱為大資料,而單一領域的大量的資料的集合更不是真正意義上的大資料。 根據一般的理解,大資料應該是圍繞特定的主題而將看起來毫不相干的資料整合在一起構成統一視圖,然後尋找到期間合理的關聯因素,從而超越簡單的統計分析而得出意想不到的結論。
阿萊克斯•彭特蘭教授指出了大資料應用比較成功的幾個領域,包括行銷場景的預測、城市管理、疾病預測、金融預測等等,這些方面都要依靠海量的資料積累和不同的客戶應用場景,互聯網搜尋引擎具有先天優勢。
百度是世界人口最多國家的最大搜尋引擎,最近也在積極加強國際佈局,剛剛又高調進入葡語市場,十幾年來積累了大量的資料資料,這是其他互聯網公司無法比擬的優勢。 「大資料」之「大」,更多的意義在於:人類可以「分析和使用」的資料在大量增加,通過這些資料的交換、整合和分析,人類可以發現新的知識,創造新的價值,並讓很多常態化的認知、判斷、思維定勢、產品形態、服務模式, 形成全新的面貌和演進方向。
顯然,百度面向的是全網使用者的全方面使用,因此是在這些領域資料資料最全的公司,最有能力展開大資料領域的探索。 通過大資料的分析,百度實現了從搜資訊到搜產品的轉變,也在資料利用方面不斷創新。
大資料不僅僅要「大」,更需要先進的資料分析與應用能力
在國內,擁有海量資料的公司不少,比如銀行、航空、通信運營商,但這些公司對資料的利用顯然不夠,限於體制與人員結構上的問題,至今在大資料方面才剛剛起步。
互聯網在這方面已經捷足先登了,騰訊阿裡都有自己的大資料應用開發團隊,百度在2013年初就成立了百度研究院,其中第一個重點方向的就是深度學習,並為此而成立Institute Of Deep Learning(IDL), 作為大資料領域的領先研究機構,為百度這兩年在大資料領域的進展做好了技術與人才準備。 本次世界盃預測模型也正是由百度深度學習研究院派遣資深資料科學家協助大資料部研發團隊共同構建的,其小組賽階段的預測成功率為58.33%,淘汰賽階段全部預測準確。
媒體報導顯示,在李彥宏親自推動下,百度深度學習研究院吸引了一大批世界級科技精英的加盟,比如前Facebook資深科學家徐偉、美國新澤西州立大學統計系教授張潼等,同時還邀請到「谷歌大腦之父」吳恩達的加盟。
大資料的應用還需要載體,不能稱為無本之木
橫空出世的小米手機、特斯拉的電動車、樂視的超級電視、海爾的空氣盒子、引發熱潮的微軟小冰、熱播的《紙牌屋》之類的產品,它們和傳統的創新型產品似乎並無很大差異,但背後其實都有大資料應用的影子。 以大悅城為例,當消費者想去一個商家,百度會通過大資料存儲和分析告訴他,這個商家在幾層,裡面有多少人;消費者想離店,百度地圖將指引具體路線、怎麼去停車場,更準確地找到自駕車輛。
大資料的價值要通過相應的產品體現出來,比如,智慧可穿戴設備就離不開大資料的應用,否則將變成死氣沉沉的玩具。 在大資料的利用上,國內比較成熟的領域包括互聯網金融方面的風險控制、網購領域的智慧推薦以及物聯網交通管理等,比較成功的產品有阿裡巴巴的餘額寶、咕咚智慧手環、百度的百度指數等。
在大資料的應用上,百度可以說是不遺餘力。 實際上,百度也早已超越搜索,成為集合網頁、貼吧、圖片、知道、新聞等優勢資源的跨屏整合行銷平臺,覆蓋了網友所有的關鍵行銷時刻百度通過「知心搜索+輕應用+語音搜索+LBS方圓定位技術」等技術,百度正努力實現「 讓搜尋引擎像人腦一樣智慧」。 資料顯示,2013年百度淨利潤有三分之二支出具有「科技感」的移動專案上,智慧手環、智慧手錶、電子秤等等都有涉及,還據說在研發無人駕駛自行車。
總體上說,大資料的發展需要扎扎實實的應用,不能總是玩概念,更需要多方面的積累資源提升技術水準,在資料存儲、資料分析和應用場景上不斷開拓創新,如此才能真正觸摸到大資料的靈魂。
原文連結:HTTP://majihua.baijia.baidu.com/article/28140