「資料,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。 人們對於海量資料的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。 」大資料時代的到來,最早由全球知名諮詢公司麥肯錫提出。
的確,這是大資料的時代。 在紐約市曼哈頓區南部的華爾街,投行根據民眾情緒拋售股票;對沖基金依據購物網站的顧客評論,分析企業產品銷售狀況;就在剛結束不久的巴西世界盃上,谷歌[微博]的雲計算平臺通過對大量球隊資料的分析, 成功預測了世界盃16強比賽每場比賽的勝利者。
大資料是繼雲計算、物聯網之後,IT行業又一大顛覆性的技術革命,當雲計算為數據資產提供保管、訪問的場所和管道時,資料才是真正有價值的資產。 無論是企業內部的交易資訊,還是互聯網世界中的商品物流資訊,其數量與即時性將遠遠超越現有企業IT架構和基礎設施的承載能力。
曾經很長一段時間裡,大資料只停留在概念層面,而互聯網、行動裝置的發展則讓這個概念落地成為現實。 大資料意味著什麼?如何盤活這些資料資產,以促進企業業務創新,利潤增長?這些都是大資料的核心議題。
大資料價值
從字面理解,大資料首先要足夠「大」。
一組名為「互聯網上一天」的資料告訴我們,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多(相當於美國兩年的紙質信件數量); 賣出的手機為37.8萬台,高於全球每天出生的嬰兒數量37.1萬...... 截至2012年,大資料的量級飛速增長,資料量從 TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)甚至ZB(1024EB=1ZB)級別。 IBM[微博]的研究稱,整個人類文明所獲得的全部資料中,有90%是過去兩年內產生的。 到2020年,全世界所產生的資料規模將達到今天的44倍。 難怪亞馬遜[微博]前任首席科學家Andreas Weigend說,「資料是新的石油。 」
1號店董事長於剛在接受媒體採訪時表示,大資料的價值體現分四個階段。 一開始資料是原始和零散的,表面看不出規律,經過過濾和組織後成為資訊;再將相關聯的資訊整合和有效呈現後轉化為知識,把對知識的深層領悟昇華到理解事物的本質,並可以舉一反三成為智慧。 所以資料是源頭,是決策和價值創造的基石。
而對於不同行業,大資料有著其特有的意義與價值。
在互聯網行業,大資料指的是這樣一種現象:互聯網公司在日常運營中生成、累積的使用者網路行為資料。 以百度[微博]、阿裡巴巴[微博]、騰訊等巨頭為代表的平臺型企業彙集了海量使用者和商家,聚集成富有張力的生態系統。 它們的大資料應用不再僅僅局限于企業本身,而是逐漸成為滋養整個大生態系統的血液。
阿裡巴巴資料委員會主席車品覺曾一語道破阿裡巴巴的大資料策略。 「在資料化運營階段時,資料就產生價值,你有意識地用它,但卻沒有關注它。 而當你發現資料已經和戰略融合後,你認識到要有意識收集它,管理它。 」如果將阿裡巴巴的大資料比做食材,那麼自己用原料做菜,和將食材提供給其他廚師相比,二者對原料的關注度完全不同。
易傳媒移動運營研發中心副總裁高照在接受《中國產經新聞》記者採訪時表示,對於互聯網企業來說,大資料意味著「能帶來立刻購買與回報的資料」,即立刻能促進使用者購買的資料。
「毫無疑問,互聯網企業對於資料非常重視,只不過他們在大資料的層次上稍有不同。 這些企業接近最終消費達成的一端,他們本身就是資料製造者,擁有海量的使用者消費資料。 同時他們擁有處理資料,以及挖掘資料的能力。 」高照說道。
硬幣的一面是互聯網企業對於大資料的嫺熟運用,另一面則是傳統行業在大資料的語境下被互聯網企業徹底顛覆。
傳統意義上,金融系統都是基於資料庫的,很多金融業務系統已經構建,如BI、資訊分析。 然而根據科斯定理,基於大資料的直接金融交易或會令金融機構的仲介價值消失。 假設在互聯網支援金融市場完全互聯網化,完全是供求方和需求方直接交易的情況下,交易成本會減少很多。
有專家認為,大資料可以提高金融機構的運營效率,降低成本。 如果將網上銀行、網上保險這些非結構性資料都備植到大資料平臺上,則可以在歷史資料和新資料增量的背景下,為金融機構提供全面的資料分析與整合。
《互聯網金融》雜誌副總編、中央民族大學法學院教授鄧建鵬對《中國產經新聞》記者表示,對於金融機構來說,大資料的重要性不言而喻。 能否很好地運用企業和客戶資料,對金融機構挖掘優質借款人,以及識別風險都起著重要作用。
大資料轉化
在《大資料時代》一書中提到,未來,資料將會像土地、石油和資本一樣,成為經濟運行中的根本性資源。 資料科學家被認為是下一個十年最熱門的職業。
事實上,當你仍然在把微博等社交平臺當作抒情或者發表議論的工具時,華爾街的斂財高手們卻正在挖掘這些互聯網的「資料財富」,先人一步用其預判市場走勢,以此取得了不俗的收益。 數以PB計的資料因得到了有效轉化與利用,重新煥發了其價值。
擁有龐大資料生態的阿裡巴巴,已經攢下了超過100PB已處理過的資料,等於104857600GB,相當於4萬個西雅圖中央圖書館,580億本藏書。 對於阿裡金融來說,資料庫就是其核心資產。
基於採集到的海量企業資料,阿裡前期會搜集包括商家平臺認證和註冊資訊、歷史交易記錄、信用記錄等結構化資料,以及使用者評論等非結構化資料,同時還引入外部搜集的用電量、銀行信貸等資料,做出放貸與否、放貸額度的精准決策。
對於淘寶賣家,阿裡會綜合其每月的交易額、發貨位址、手機號段、家庭住址、性別等資料,以作為信用評價的維度之一。 通過對賣家進行定量分析,借助「淘資料」,「資料魔方」,「聚石塔」等資料產品,阿裡巴巴精准轉化與利用了平臺上的海量資料。
高照認為,企業對於大資料的利用,本質上都是通過資料説明品牌建立起對消費者的精准洞察。 企業可以通過原有資料獲得更多新資料,以此提升產品性能,實現產品更新換代。
與此同時,大資料的轉化過程也是大資料生態的構建過程。 這個生態包括資料生產者、資料記錄者、資料處理分析者、甚至資料消費者。
「大資料生態的上下游是千億量級的產業鏈。 」高照說道。 遍佈于城市各個角落的智慧照明系統,可以成為城市大資料的一個採集器,就如同智慧手環可以給使用者提供確實性的健康資料。
海量資料在創造互聯網生態的同時,也令互聯網與金融的邊界越來越模糊,由資料採礦產生的金融創新,正在深刻改變著傳統金融機構的運作模式。 作為資料密集型的行業,金融業應如何通過挖掘和分析資料來進行決策,成為當下一個重要的議題。
鄧建鵬表示,銀行掌握的客戶資料比較單一,還有很多資料銀行並沒有掌握,比如使用者每個月的水電煤氣費,坐火車飛機的行程單,以及上網購物的足跡等。 因此,如果銀行能進一步豐富資料範圍,全方位開發客戶資料,對於銀行開發更多的優質借款人,進一步識別風險都有好處。
事實上,面對大資料時代的到來,銀行也已開始發力。 如民生、中信、光大等多家銀行已開展供應鏈金融服務,實現了從「線下手工處理」到「線上多系統集成」的轉變。 具體的做法是,線上整合與銜接各方流程,建立商務、資金服務與物流服務銜接的工作通道,讓融資線上可得;同時整合與共享銀行、核心企業與上下游企業,以及物流夥伴之間割裂的分散資訊,讓供應鏈管理與服務清晰可見。
與此同時,銀行也開始涉足互聯網平臺,如建設銀行的善融商務,工商銀行的電商平臺,都意在大資料。
和互聯網企業一樣,傳統金融機構最後也會形成獨特的大資料生態。 鄧建鵬表示,傳統金融機構本身擁有資料,如果完全依靠自身的系統去挖掘與轉化資料,成本非常高。 因此,和互聯網巨頭合作是很好的方式。 銀行可以利用互聯網企業的資料,開展各項服務,最終達成共贏的生態圈。
「重視」大資料
資料獲取得越多,變數越多,由此帶來的資料「噪音」也越多。 在大資料的海洋中,有相當一部分是無用的資料。 有些資料對企業暫時沒有用,有些則永遠沒用。 大資料本身良莠不齊,如何才能更好地判別資料價值?
eBay[微博]大中華區CEO林奕彰認為,那些現在看起來不正確資料,明後年可能就會隨著科技進步被消化,目前只能先把這些資料儲存起來。
大資料廠商Teradata天睿公司CTO寶立明表示,不能一昧否定看似無用的資料,它們同樣蘊含著價值,它們確切的說法應該是低價值密度資料。 企業只是尚未找到其價值體現手段,因此可以用低成本的存儲伺服器加以保留。 例如,當人們通過搜尋引擎檢索時,會出現一些習慣性的拼寫錯誤。 這些錯誤資料雖然表面上沒有意義,但通過收集這些資料卻可以發現大量的使用者習慣和規律。
「並沒有一個通用的大資料法則。 每個企業都需要根據自身情況去制定自己的菜譜,從而説明自己更好地消化這些資料。 」高照說道。
高照表示,每個企業需要的資料都不一樣。 比如,車企需要的資料體量比較小,但單個資料的價值很高,並且這些資料在一段時間內還會進一步發揮價值。 相比之下,快銷品的使用者傾向于持續購買,因此快銷行業的大資料系統都在百萬千萬級別。 所以,行業不同,對資料採礦的週期、維度也不同。
有專家指出,雖然資料是真實的,但是它會有偏向性,不同的分析方式,會有不同的解讀,所以它可能並不完全客觀。 要審慎地用正確的方法處理資料,才能獲得正確的資訊。
如果說無用資料會帶來資料噪音,那麼安全問題就是懸在大資料頭上的「達摩克利斯之劍」。
基於大資料可以對人們的狀態和行為進行預測,未被妥善處理的大資料會對使用者隱私造成極大侵害。 社交網路研究表明,通過群組特性可以發現使用者屬性。 例如通過分析使用者的Twitter資訊,可以發現使用者的消費習慣以及喜好的球隊等。
有專家表示,應該對使用者隱私提供一定的保護,例如通過資料加密,只讓需要知道資料的人瞭解、接觸或者訪問到這些資料。
隱私侵入問題不僅存在於個人使用者,也存在於企業。 從心臟出血漏洞、攜程拖庫等事件可以看出,駭客利用大資料分析向企業發起的攻擊更為精准。 對此高照表示,在大資料層面,企業最重要的是建立自有資料平臺。 在該平臺,只有內部人在一定許可權許可下才可以訪問和使用。
有專家表示,可靠的資料存儲、安全的挖掘分析、嚴格的運營監管是大資料時代企業安全的剛需,安全產業鏈協同成為必然趨勢。 資訊安全需要在政府主管部門的統一協調管控之下,由產業鏈各個環節的企業開放安全資料和技術能力。
「大資料安全是一個永恆的話題,重要的是通過技術手段,降低安全風險。 」鄧建鵬說道。
現在,大資料帶來的資訊風暴正在變革我們的生活、工作和思維,開啟了一次重大的時代轉型。 被譽為「大資料商業應用第一人」的維克托·邁爾·舍恩伯格指出,大資料時代最大的轉變就是放棄對因果關係的渴求,而取而代之關注相關關係。
的確,大資料已為我們的生活創造出了前所未有的可量化的維度,大資料已經成為了新發明和新服務的源泉,而更多的改變正蓄勢待發。