「大資料(BigData)」,從一個海外生詞變成了國內熱詞。 其中,兩個大資料經典案例被津津樂道:其一,谷歌公司利用海量搜索資料,成功預測2013年美國流感暴發;其二,微軟公司通過大資料分析處理,對新一屆奧斯卡金像獎作出「預言」,結果除「最佳導演」外,其餘13項大獎全部命中。 一時間,人們對各類大資料應用暢想紛紛,那麼身處大資料時代的上海,可以有何作為?
資料富礦:沉睡還是說話
資訊爆炸時代,「資料礦藏」已極其富饒,問題是讓它們永遠沉睡、還是開口說話——通過大資料獲取與加工獲取大價值。
上海30多家三甲醫院已實現診療資訊互聯互通,市級健康資訊網上的市民健康檔案,記載資料多達數十億條。 這些資料夠大,但應用還不夠大。 深度解讀這些資料,可從中回饋新藥療效,指導醫生行為,還可向醫療或商業保險提供量化依據等。 同在衛生領域,谷歌等IT巨頭正是根據線民搜索醫院、藥品等的資料資訊,找出疾病發生發展的規律。 大資料的邊界絕不僅僅局限于一個行業的「資料圈」。 當股民盯著螢幕上的紅綠數位,當機構觀察著資金流向與流量,華爾街的資本大鱷已經運用超級電腦,即時分析著全球數億微博使用者的留言,抓取與上市公司有關的評判,用以決定某些股票的買入賣出,全年僅此一項就能增加多個百分點的收益。 這就是基於市場情緒與投資心態的「金融輿情決策投資」。
聯合國2012政務白皮書提出,希望各國各地區都用好大資料帶來的「歷史性機遇」。
資料中心:轉型「頭腦經濟」
大資料是一座可再生的金礦。 按照「四個中心」建設戰略,上海本身就是經濟、貿易、金融、航運等領域海量資料的集散地,具備得天獨厚的大資料優勢。 彙聚資料大流,可成為資料中心。
據中國銀聯電子支付研究院助理院長何朔介紹,「銀聯」處於我國銀行卡產業的核心樞紐位置,擁有全面、海量的銀行卡支付資料,「這是一筆巨大財富」。 對銀聯來說,他們以持卡人、商戶、合作機構作為大資料客體,去構建合適的資料模型和分析演算法,從中獲取隱藏在交易資料背後的價值,探索和掌握持卡消費、投資規律。 在大資料產業鏈的前端,上海基礎良好。 早在1996年,上海便提出建設國際資訊港戰略。 如今,上海資訊化水準國內領先,光纖到戶覆蓋能力、無線局域網覆蓋密度、都會區網路出口頻寬均為全國第一,有條件發展為吞吐大資料的「樞紐港」。
而大資料產業鏈的更大「增值」階段可能是後端——從資料傳送或存儲中分析出價值。 大資料是一種基於智力的資訊服務,佔用實體資源少、產生附加值高,屬於「頭腦經濟」。 市經濟資訊化委專家認為,這不僅是上海希望發展的服務業,也符合上海產業優化升級、向高端轉型的趨勢。 目前,滬上第三產業增速最大的板塊就是資訊服務業,現有規模以上的資訊服務企業約4600家,從業人員達40.8萬人,發展大資料產業關鍵是集聚相關創新人才,包括為大資料研發模型和演算法的應用數學家、軟體工程師等。
大資料,正成為上海資訊服務業乃至服務業加速做大做強的新增長點。 如,大資料將為上海著力推進的雲產業提供極為豐富的「內容」。 上海普元資訊技術股份有限公司技術總監王延炯透露,其大資料業務現已覆蓋大型商業銀行、券商、保險、電信運營商、電力系統等,主要面向央企大客戶。 這些客戶普遍擁有數百個IT系統,每天產生的資料堪稱海量。 「不同于常見的事前或事後分析,對於即時性要求極高的業務場景,必須實現高速運算、事中分析。 」
一批滬上企業已開始像普元那樣分包資料業務,在大資料價值鏈上掘金。 根據新近出臺的《上海市推進戰略性新興產業(2013—2015年)「雲計算」專項實施方案》,3年後,申城雲計算產業規模預計迅速通過1000億元大關,其中大資料的貢獻度值得預期。
資料流程通:「1+1」大於3
大資料仿佛一面大蛛網。 上海勾畫「大資料樞紐」藍圖,除了蛛網上收放資料的「輻射線」,還少不了溝通資料的「同心圓」。 專家建言,讓大資料流程動起來,尤其是跨界流動,能產生「1+1」大於2、甚至大於3的效益。
在上海社科院數量經濟研究中心副主任韓清看來,大資料不同于海量化的「資料倉儲」及其資料採礦技術,它的「大」更是指資料分析的廣泛和深入。 通過將不同範圍、不同區域、不同領域的「資料倉儲」加以綜合,從中獲得單個「資料倉儲」無法獲知的新資訊,才能發現新價值,帶來新機會,這才是大資料概念的革命性所在。 「比如氣象、保險部門的資料結合起來,可高效率地研究防災減災;運用信用卡刷卡資料結合抽樣調查,能更快捷、更精確測得CPI指數。 」
發展大資料必須把大資料產業上升到戰略高度,全面升級資料管理方式。 一名院士曾受邀為某地智慧交通做諮詢,但他發現,這座城市涉及交通的「有關部門」超過10個,每個部門都有自己的資訊化系統,但這些資料資訊只存在於垂直業務和單一應用中,與鄰近業務系統缺乏共通聯動。 有關主管部門人士認為,上海各委辦包括各大企業的資訊化管理水準已具有相當深度,應逐步合縱連橫、相互打通,讓「大資料流程」左右逢源,提升其含金量。
上海軟體產業促進中心主任唐全榮說,對於上海,交通資訊智慧應用正是非常好的大資料突破機會,比如發改委支援平臺建設,科委支援演算法研究,經信委推動產業化應用,由政府立項、企業投標,可在一定區域內先做示範,再行全市推廣。 「若使上海交通順暢度提升20%,便是一個大資料成功案例。 」
(責任編輯:蒙遺善)