5日,2013年大資料技術大會在北京召開。 CCF大資料專家委員會秘書長程學旗代表大資料委員會宣佈2013年大資料白皮書和2014年《大資料熱點問題與發展趨勢》正式發佈。
程學旗表示,2013年大資料白皮書從大資料發展背景、技術體系現狀、產業鏈和環境、人才培養人才資源五大章節對2013年大資料的整體環境做出總結,並在第六章對大資料發展趨勢做出思考闡述。
委員會預測,網路大資料、金融大資料、健康醫療大資料、企業大資料、政府管理大資料和安全大資料將成為2014年大資料最具發展優勢的六大應用領域。 並分享了大資料未來發展的10大趨勢:
1.大資料從概念化走向價值化
2.大資料處理架構的多樣化模式並存
3.大資料安全與隱私越來越重要
4.大資料分析與視覺化成為熱點
5.大資料產業成為戰略性產業
6.資料的商品化和資料共用的聯盟化
7.基於大資料推薦和預測正逐步流行
8.大資料性能成為支撐性的技術
9.資料科學的興起
10.大資料生態環境逐步完善
以下為程學旗演講實錄:
剛才大會的主席包括我們大會的承辦方李院士對我們大會的主題,大會的定位做了詳細的分析。 大會由中國電腦協會主辦,是我們電腦學會大資料專家委員會具體操作協辦這個事情。 我們除了邀請一線頂級的專家來跟大家分享我們技術上認識和技術上進步之外。 這裡面剛才李院士講過我們大資料會上有幾個環節,一個我代表大資料委員會向社會發佈關於2013年大資料白皮書和2014年《大資料熱點問題與發展趨勢》,我這個下面就是2013 第一屆中國大資料技術創新與創業大賽。 第一部分是大資料白皮書。 在大資料專家委組織下花了差不多半年時間,有120名參與,有50名專家直接撰稿提供材料,來自科研院所、企業和政府部門,涵蓋電腦系統、資料庫以及大資料方方面面應用領域的高級專家。 白皮書前後修改了十余次,正式版本有八萬字,一定程度反映了大資料學術界和產業界的共識。 我們組織白皮書意圖是什麼? 我們希望為業界梳理大資料應用現狀和發展趨勢,為政府制定推動大資料發展的政策提供一些建議。 同時也希望能夠探討大資料研究當前面臨的科學問題和挑戰,供相關領域研究人員提供參考,我們希望為業界、政府和我們從業具體科研人員提供説明。
關於白皮書
白皮書分六個章節。 第一章節關於大資料發展背景。 第二典型的業務先兆,互聯網大資料,通信大資料,網路空間安全大資料,城鎮化大資料,金融大資料,健康醫療大資料和生物資訊和製造大資料。 我們把這個環節想重點寫,由於篇幅有限我們白皮書裡面這個環節寫的比較簡要,我們希望在未來版本裡面把大資料應用的環節做的更加深入和詳實,資料的價值只有應用起來才能體現它的價值和前景。
第三部分大資料技術體系現狀,我們把大資料整個技術的圖跟資料獲取、計算挖掘做了詳細的闡述和介紹。
第四章介紹大資料產業鏈和環境。
第五章介紹大資料人才培養人才資源,只有好的資源才能推動我們產業發展。
最後一章對大資料發展趨勢和建議專家委做一個簡單的總結和思考。 我們第六章建議和思考基於我們2012年發佈的熱點問題和發展趨勢以及我們現在看到發展情況,我們今天發佈的這個可能在我們明年發佈的白皮書裡面做進一步的闡述。 整個專家委第一次撰寫這樣的白皮書,來回改了十余次,這樣書中內容有一定偏頗和錯誤,我們希望逐步的完善,也希望我們業界、使用者能夠對白皮書提出一些改進的建議。 稍候白皮書將在中國電腦學會的官方網站正式發佈,在會場我們印了一部分紙質版由於數量有限,我們大會之後立即面向社區免費公開。 這是第一部分關於大資料發展白皮書。
下面我們重點講一下2014年大資料發展趨勢預測。 從去年中國電腦協會大資料專家委員會成立之後保留節目,我們過程跟去年一樣,持續了大概三個月左右,從開始一些調研,大資料的趨勢涉及到哪些領域哪些話題做一個調研,然後做一些收集,形成一些侯選的集, 然後列成表格方便大家投票描述的表格,最後由專家委投票。 目前結果是由120多位裡面90個委員投票,形成我們今天的報告。 我們去年分兩個環節,一個熱點問題一個發展趨勢。 今年發佈了白皮書,熱點問題我們融入了白皮書,這裡面我們更多思考2014年或者說近期大資料業界發展一些趨勢的預測。 這個預測我們首先十大發展趨勢是我們經過統計,經過大家投票。
關於十大發展趨勢
第一個發展趨勢我們總結叫做大資料從概念化走向價值化。 票選是第一位,總票選93票涉及幾個方面,大資料向更多領域進行擴張。 我們知道從去年今年大資料變成一個非常熱的詞。 在每個應用領域裡面大家都提大資料,比如說我們是大資料金融、大資料安全、大資料製造、大資料物流、幾乎每個領域都提到大資料。 大家每個人講這個概念,我們大資料專家委員會發現在一些領域裡面實實在在的落實了大資料的價值。 所以今年整個我們講這些趨勢用一個關鍵字來講就是說務實。 2013年中國大資料從2012年概念炒作到2013年走入務實可持續發展的階段,正是由於這個情況我們十大發展趨勢第一個趨勢就是大資料從概念走向了價值化。
第二發展趨勢大資料處理架構多樣化模式並存。 hadoop與大資料之間的關聯和差異,反映了我們大資料專家委大家的共識,大資料處理不是拿某一個東西,我們資料的管理也許關係資料同樣存在,肯定還同樣存在,並不是由一個架構處理解決所有大資料問題,實際上由實際需求驅動的。 我們在這個總票選71票,得票比較高是大資料處理多樣化模式並存。 專家委的意見就是hadoop的一些新的GPU的處理架構並存。 大資料存儲和管理未來會推動存儲與管理能力技術提升。 和議題相關記憶體計算成為提高主要的處理之一。 大資料處理架構的多樣化模式並存。
第三發展趨勢大資料安全與隱私越來越重要。 這個問題基本不用我們解釋,我們去年這個議題已經非常重要了,有了大資料之後一些碎片化看上去不涉及到那麼安全那麼隱私的問題,隨著大資料的融合,一是帶來一些安全上的挑戰,同時為安全提供了新的機會。 這有兩項投票結果,大資料安全33票,大資料個人保護和隱私立法得了20票。
第四趨勢大資料分析與視覺化成為熱點。 我們說今年有一個關鍵字務實發展。 務實發展分析視覺化,大資料專家委投票裡面趨勢越來越具體化。 視覺化成為很多專家討論議題,有了大資料以後大規模多角度多視角多手段的資料視覺化,整個貫穿了資料分析和資料展示過程,還有即時處理分析和大資料的處理方法,三個相關結果票選是61票。 我們前面的票少一點,是因為我們點出中間主要的選項。
第五發展趨勢大資料產業成為戰略性產業。 第一專家委員認識首先大資料產業成為國家戰略性新興產業是保障國家安全一個重要戰略。 大企業大資料和政府大資料是一些支柱型產業,總得票71票。
第六發展趨勢資料的商品化和資料共用的聯盟化。 這是我提的詞。 資料共用聯盟是我們去年大家議論的議題,由於資料共用聯盟生態環境去年有一些不足,大家還是希望資料共用聯盟能夠逐步壯大,成為產業、科研和學術一個環環相扣的支撐環節和產業發展的核心環節。 另外一個觀點由於資料變成資源變成有價值的東西,資料私有化和獨佔問題是客觀存在的,在客觀存在如何界定資料傳輸,以及讓資料有資料傳輸保護情況下資料商品化是未來一個重要的發展趨勢。
第七發展方式基於大資料推薦和預測逐步流行。 我們看到很多關於大資料大科普書講很多大資料的推薦,大資料的預測。 專家委覺得在中國大資料科研和產業這一塊真正開始落到實地,大資料裡面總票選76票,大資料預測和精確個人化推薦系統和精確網路行銷得票率非常高。
第八深度學習與大資料性能成為支撐性的技術,裡面涉及到有幾個議題,我們專家委員會委員提出來的,包括深度學習成為大資料智慧分析的核心技術。 基於海量技術智慧成為發展的熱點,利用群體智慧和眾包計算支撐大資料分析和應用。 這個跟前面的分析、預測都成為大資料技術一些實實在在的價值,實實在在的一些技術。
第九趨勢資料科學的興起。 我們去年也有這樣一個評價,這樣一個預測,今年比去年稍微晚一下因為我們做分析,具體選項三個方面。 資料科學興起,大資料評測基準,以及所有科學正迅速變成以資料驅動的科學,大家對資料科學興起有更具體的認識。
最後一個大資料生態環境逐步完善,雖然我們大資料生態環境目前沒有完善到我們滿意程度但是它在逐步的完善。 開源逐步成為主流,大資料、雲計算、物聯網相互交融,尤其是大資料教育,電腦群組織的教育相關的活動,這個裡面大資料教育更多是對人才方面,對教育培養大資料人才方面也有大家的一些共識。
我們預測從現在到明年未來比較短的內十大發展趨勢,十大發展趨勢跟去年對比,基本上大部分問題,大部分的情況,包括技術、發展趨勢,問題似乎仍然在這個範圍,但是看到更加的具體,我們把下面做一個簡單的對比分析。 去年資料資源化,大資料安全資料科學興起等等,我們把剛才十個提煉問題我們變成小的選項來看,去年的問題也在十個預測裡面。 有一個有意思的現象大資料產生新職業,我們預測第九個發展趨勢,今年投票排到第31位,可能大家覺得大資料產生的職業很自然不把它放在什麼重要的問題來看,有些問題已經非常靠後了,當然還有產生一些新的, 比如說大資料成為國家戰略新興產業,大資料預測精准的推薦,大企業大資料,這些發生了新變化,一些更具體化,大資料發展更加明確。 這裡面我們看到排名裡面比如說資料科學興起排在後面,我們去年排在前面。 為什麼現在排在後面? 就是大家更關心大資料具體的東西,科學是逐步的實踐中得出來的。 我們熱點問題總共選項57項,包括我們根據去年總結以及各位委員提議做一些彙聚,我們看10個發展趨勢從57項裡面選擇做一些歸類,並沒有都歸在裡面。 我們簡單翻一下票選的結果。
第一項根據大資料走向價值化,大資料商品化,大資料一些預測,企業大資料等等。 整個每一項一些單項我們看到有一些我們並沒有列在裡面,比如說生態系統平民化,跟我們提煉出來幾個趨勢非常相關的。 我們再往下走的時候,到最後,57項大家投票的時候一個詳細版本十多頁,簡單版本就是五六頁,一般投票我們到後面就懶得看了,我們在後面還能得到很多票選,100多個委員對這個問題做過詳細思考和認真提煉的。 在十大發展趨勢同時我們對具體的應用領域和技術一些情況各位委員也做了一些判斷。 這方面我們對2014年大資料最受矚目的應用領域,互聯網、金融、能源、網路、企業製造等等,今年去年大家熱炒領域,去年我們專家委委員給出一些預測,醫療、電子商務等。 我們看2014年得票最高的互聯網、電子商務、金融、健康醫療和輿情,輿情說企業輿情,大企業分析這一塊。 最可能產生價值的應用領域,金融大資料和互聯網大資料、電子商務,電子政務這是我們都能想像出來的,企業情報和健康醫療也成為大家非常期望的一些趨勢。 除了這個之外我們進一步的分析我們其他票選,不僅僅包括這幾個領域,社區的廣告行銷得票率也很高,包括城鎮化、智慧城市等我們把後面結果做了分析,最後我們得出結論2014年最令人矚目有六大應用,網路大資料:互聯網、電信、 網路大資料。 金融大資料、健康醫療大資料、企業大資料、政府管理大資料、安全大資料(社會安全、網路空間安全)。 我們預測2014年度最令人矚目的工作在這六個行業。 我們雖然很多領域說能源氣候環境自然科學大資料,我們投票裡面幾乎沒有人選擇,這兩個方面。 一是可能我們委員大部分來自IT界我們關心問題更多關心像互聯網大資料,電子商務大資料等等這些方面的東西。 另外一方面就是說可能在製造業、工業能源這塊在大資料領域本身我們的活躍度跟我們網路大資料、金融大資料還是有所滯後一些的,關於應用方面。 去年大資料分散式預測有三個方面。 今年預測更具體細節一點。 一方面大資料學習與挖掘,這個得票率非常高,包括深度學習和機器學習,這個兩個相關。 現在有人說大資料不要學習了,直接從資料到資料就可以了。
第二方面大資料計算架構和系統,這個大家都能想得出來,我們講Hadoop體系,大家期望未來在技術上產生突破。
第三歸為大資料分析和視覺化,自然語言、視覺化、複雜網路、圖計算,跟大資料相關學科技術三類,大資料學習和挖掘,大資料存儲結構和系統,大資料分析和視覺化問題。
總結一下2014年大資料委員會預測最令人矚目應用六個,網路大資料、金融大資料、健康醫療大資料、企業大資料、政府管理大資料、安全大資料。 大資料學習挖掘,分散式運算,大資料視覺化。 分析挖掘,存儲結構與系統,資料獲取以及資料化方面。 十大趨勢:從概念走向價值化的大資料,大資料處理模式多樣化並存。 大資料安全隱私成為重要問題,大資料分析和視覺化越來越實在。 大資料產業成為戰略性的新興產業。 資料商品化和資料共用聯盟化的這種生態是未來一個重要的趨勢。 基於大資料的推薦預測逐步流行,深度學習與大資料智慧成為支撐的技術,資料科學的興起以及大資料生態環境的逐步發展,這是十個熱點問題。 謝謝大家!