近日,由中國電子學會主辦,中國電子學會雲計算專家委員會和中國雲計算技術與產業聯盟承辦的「雲計算與大資料」專題研討會在北京京西賓館隆重召開。 中國電子學會名譽理事長、原資訊產業部吳基傳部長,以及工業和資訊化部周子學總經濟師先後致辭,對中國電子學會精准把握新一代資訊技術發展特徵表示肯定,對召開大資料方向具有前瞻性、基礎性的研討會表示祝賀。 出席本次研討會的領導和嘉賓還有:工業和資訊化部軟體與服務業司陳偉司長、李未院士、李德毅院士、倪光南院士、中國電子學會副理事長劉汝林、中國電子學會秘書長徐曉蘭、 中國電子學會副秘書長林潤華以及中國電子學會雲計算專家委員會和中國雲計算技術與產業聯盟的專家代表共50余人。
研討會由中國電子學會雲計算專家委員會主任委員李德毅院士主持,李未院士、李德毅院士、百度公司技術委員會理事長陳尚義博士、中科院計算所何清研究員、中國移動通信研究院錢嶺研究員、 北京友友天宇系統技術有限公司總經理姚宏宇博士分別就雲計算與大資料話題發表了精彩的主題演講。
「四面體模型實現非結構化資料管理」
在李未院士看來,軟體產業面臨了三次浪潮,第一是結構化資料+演算法,其主要基礎軟體是作業系統如Windows與資料庫;第二是半結構化資料+搜索,形成了諸多搜尋引擎如百度、Google還有電子商務如亞馬遜 ;第三是非結構化資料服務+即時服務,代表是非結構化資料管理系統和集成的各種服務。
大資料時代,資料模型變得更為重要,增加了智慧化處理、關聯化檢索以及知識挖掘等資料模型要實現深度提取和共用,需要新的改變。 李未院士帶領團隊自2009年開始,特別研發了高級非結構化資料——四面體模型,以統一資料模型為突破口,結合文本圖像,圖形、音訊、視頻的特性實現新型非結構化資料的管理系統。
李未院士指出,未來90%的資料將是非結構化資料,而且增長迅猛,針對非結構化資料建立新型資料模型是非結構化資料管理系統的關鍵,李未院士提出四面體模型(即基本屬性刻面、語義特徵刻面、底層特徵刻面、原始資料刻面), 四面體模型具有完備、關聯、集成、可擴展等特性,易於實現對超量的非結構化資料創建、維護與管理,可以成為非結構化資料模型的標準,必須使用群體軟體工程的理念和技術來生成、管理和維護非結構化資料。 四面體模型已經在500萬個非機構化樣例中得到了廣泛測試,未來還將進一步從感應器開始,更多地通過群體軟體來完善非結構化資料中的四面體。
「寬頻不寬制約大資料發展」
李德毅院士:寬頻不寬依然是制約雲計算與大資料發展的瓶頸
在第四屆中國雲計算大會上,李德毅院士曾明確指出「寬頻不寬」制約了雲計算的發展。 如今面對大資料,李德毅院士仍然表示:「互聯網和雲計算是大資料產生的基礎,寬頻不寬依然是制約雲計算與大資料發展的瓶頸。 」
圍繞「什麼是大資料,如何處理大資料」,李德毅院士列舉了資料具有低密度價值的特徵,需求特點是使用者驅動型,並著重以位置雲服務為例,說明目前大資料在行業中的應用現狀。 而通過科學發展與目前大資料技術的關聯,以及大資料發展中存在的技術限制,李德毅院士表示:「現在不一定先有科學後又技術,很可能是技術中有科學,科學中有技術。 大資料時代的科學價值(正在一步步體現)。 」
「大資料帶來產業變革」
陳尚義博士從百度大資料特徵入手,分析了大資料帶來的技術和產業變革,認為目前資料規模及增長速度超越了處理能力,在資料智慧成為現實的同時也引發新的安全危機,改變了學術研究和技術革新的思路,而且創新模式發生了根本改變。
何清研究員從大資料的演化、資料採礦發展歷程、大資料採礦雲服務實踐三個方面指出大資料採礦演算法往往是高複雜度甚至是NP難題,需要儘量把全域最優問題轉化成局部最優的問題,需要採用高效並行策略等。 錢嶺研究員回顧了大資料處理技術發展概況,指出電信運營商對大資料的需求點,最後通過大雲2.0闡述了中國移動在大資料應用實踐方面的創新。 姚宏宇博士分析大使用者特徵在於增長爆發性、使用突發性、需求易變性、關聯網路效應;大資料特徵在於資料量(Volume)、資料多樣性(Variety)、資料輸送量(Velocity)、資料內容(Value) ;大系統特徵在於系統高可用性、管理壓力與維護成本、性能線性延展、需求多樣性等,並對大使用者、大資料、大系統所面臨的機遇與挑戰進行了詳盡的闡述。 與會嘉賓紛紛對雲計算與大資料技術、商業模式及未來的融合創新趨勢展開了熱烈的討論。
大資料正影響著企業商業模式的轉變,對大資料進行處理、分析及整合正成為提升企業核心競爭力的有效方式。 2012年3月,美國政府更是撥款2億美元啟動「大資料研究和發展倡議」計畫。 本次研討會正是在此背景下,邀請國家相關部委主管領導、雲計算及大資料領域的著名院士專家,針對雲計算與大資料等重要問題進行探討研究,為推動國內大資料技術發展與產業變革做出積極探索。
(責任編輯:呂光)