【導讀】:進入2014年,大資料正從紅遍媒體的概念炒作逐漸落地為生財的產業。 如雨後春筍冒出的大資料服務商,在中國市場上展開了激烈角逐。 從「中國大資料服務商綜合服務水準TOP100排行榜」中,已經可以隱約看出中國「大資料雲圖」的雛形。
中美大資料雲圖比較
相比美國同類榜單,高居首位的10Gen僅列第43,而大資料股明星Tableau僅列第45,而Marketo乾脆沒上榜。 這讓我們注意到榜單標的服務範圍是中國,而非美國。
我去年到美國與《大資料雲圖》的作者芬雷布交流時,已經注意到,中美大資料產業佈局存在巨大差異。 在一年時間裡,中國大資料的產業版塊正發生巨大變化;對比大資料雲圖2.0版(2013版)與3.0版(2014版),美國的產業也在急劇變動。
美國大資料雲圖3.0版將產業版塊重新劃分為六塊,分別為數據源、開源、跨平臺基礎設施/分析、基礎設施、分析、應用。 其中「分析」領域的熱點是資料視覺化、非結構化資料;「 基礎設施」領域的熱點是NoSQL和NewSQL資料庫;「 應用」領域的熱點是廣告優化和行銷。
比較中美「大資料雲圖」,可以看出以下特點:
第一,在「資料來源」領域,中美各有特色,中國互聯網平臺資料來源和行業資料來源建設已經起步,但本地資料(語用資料、情境資料)仍有待加強。
第二,「開源」、「跨平臺基礎設施/分析」和「基礎設施」三個領域,美國處於壟斷地位。
榜單中位列前15的均是美國廠商,且多跨「跨平臺基礎設施/分析」和「基礎設施」兩個領域。 中國一些廠商認為美國相關技術專業性太強,不利於普及,更傾向短平快技術應用。 但一些企業堅持在這些重要領域耕耘,如商業智慧軟體(用友軟體,久其軟體) ; 資料中心 建設與維護(天璣科技、銀信科技、榮之聯等);
第三,中國廠商絕大多數集中于「應用」與「分析」領域。 前者如廣告優化與行銷(阿裡巴巴、騰訊等),金融、汽車、政府、健康、教育、安全等行業應用;後者如資料處理、分析環節、綜合處理(拓爾思、美亞柏科等),語音辨識(科大訊飛),識頻識別(海康威視、大華股份、華平股份、中威電子、 國騰電子)。 在應用領域,中美熱點相似度較高,都包括廣告優化、行銷、金融、產業、政府、健康、教育、安全等。
如果以上是對榜單的結構分類分析,接下來要按價值分類進行分析。
中國大資料雲圖價值分析
對大資料進行價值分類,可分為「風動」(客體價值)、「幡動」(主客體價值)、「心動」(主體價值)三類。 這是六祖壇經的價值分類法。
1、風動類的大資料,是工程師眼中的大資料,看到是技術。 典型代表是3V、4V說。 林林總總的這方面定義,可以用一個詞概括,這就是「複雜」。 大資料本質上是複雜性資料。
從這個方向觀察,中美企業差距較大。 榜上前10名基本都是屬於「跨平臺基礎設施/分析」的美國廠家。 其中HP今年剛被列入美國「大資料雲圖」(3.0版),如今赫然列在第4。 而以硬體加強大資料,7.4億投Cloudera異軍突起,HADOOP的CDH平臺占中國一半的英特爾列在第2,卻至今不在美國榜單。 顯然這是美國榜單出了問題,而中國這個榜單跟進比較及時超前。
未來發展,中國企業需要回到圖靈初衷,找到複雜性資料的感覺(而不光是象谷歌那樣迷信數學演算法),沿跨「科技-人文」二元的「資料科學」方向發展。 華為與倫敦帝國理工學院共建資料科學創新實驗室 ,是積極跡象。
工程師撲向複雜性資料,就象小孩子撲向玩具一樣,只關心是與不是這種事實評價,並不關心好與壞這種價值評價。 商務或政務的代理人關心的是技術應用於人之後產生的價值,因此要把客體與主體聯接起來。
2、幡動類的大資料,是業務代理人眼中的大資料,看到的是工具和能力。 以美國政府的定義為代表。 林林總總的這方面定義,可以用一個詞概括,這就是「洞察」。
資料越複雜,成本越高,是遲鈍(又稱工業病),為不好;資料越複雜,成本越低,叫靈活(SMART),是好。 洞察,就是指「穿透資訊迷霧」。 這是當資料進入澤位元組(ZB)時代後,避免資訊垃圾填埋,反而能保持「清清楚楚明明白白真真切切」的能力。
相比基礎技術,中國企業借助市場優勢,在應用方面具有優勢。 因此可以看到大批國內企業在榜。 其中可分為三類,一類是ICT服務商,如華為、浪潮、用友、東軟、金蝶等;一類是國內上市公司,如拓爾思、東方國信、天璣科技等「大資料概念股」;一類是互聯網企業,如阿裡巴巴、百度、騰訊等。
ICT服務商共同的特點,是從軟硬體技術服務向商業資料服務方向轉。 例如,華為發佈企業級大資料分析平臺FusionInsight ,説明企業洞察新商機。 用友通過「用友NC」 正在探索基於雲平臺的系列方案與應用服務,包括提供企業行銷管理、供應鏈、製造生產、專案管理等服務。
大資料概念股上市公司的共同特點,是從解決方案供應商在向行業雲資料服務方向轉型。 例如,東軟集團在傳統IT 服務基礎上,向車載電子和醫療服務等新興領域深化雲資料服務。 拓爾思開始做跨行業應用,和天行網安協作,提供基於資料分析的安全服務;天璣科技正從服務傳統IT架構,轉變為服務互聯網架構,從純粹的服務供應商,演變為產品和服務的供應商。 此外,一批有資料中心業務基礎的廠家也在向大資料轉,如榮之聯、中科金財等。
互聯網企業,如百度、騰訊、阿裡等擁有資料的平臺型企業,紛紛針對自身的平臺使用者提供資料分析業務,並且向金融、環保、交通、醫療等行業的資料分析應用逐漸滲透。 例如阿裡巴巴開始做金融行業的資料分析應用。
透過目前的榜單,我們可以看出一個目前尚不明朗的潛在趨勢。 這就是亞馬遜模式的興起。 亞馬遜的重要性,我認為不能僅看到它排名第7這個表像而有所忽視。 事實上亞馬遜的大資料收入,是排位在前的所有廠商之和還要多許多。 據Synergy報告顯示,2013年第三季度,亞馬遜獲取了美國雲計算市場總收入25億中的多數份額,本身收入提升55%。 Synergy估計,亞馬遜第四季度雲計算收入將達7億美元,比微軟、IBM、谷歌、Salesforce.com的總和還高出15%。 這不是偶然的。 限於篇幅不展開談。 這意味著中國企業中近亞馬遜模式的,如阿裡巴巴、用友、東軟、金蝶等,還有更大潛力空間。
穿透今天這個排名來看明天,我們需要高度重視這樣一個市場信號:大資料應用的主戰場,可能並不象人們一般以為的那樣,是在資訊技術服務領域,而可能轉向商務服務領域。 這是ICT服務商、大資料概念股和互聯網公司未來共同的轉型升級方向。 此外,大資料的絕對優等生FACEBOOK在中美大資料雲圖中都不見蹤影,但類似模式卻代表前沿方向。
3、心動類的大資料,是委託人(領導者與最終消費者)眼中的大資料,看到的是目的和意義。 以IBM的智慧計算為代表。 林林總總的這方面定義,可以用一個詞概括,這就是「意義」。
有能力,卻不明確要解決什麼問題,大資料就是屠龍之術。 大資料工作的結果,如果是把符合意義的資料留下來,叫智慧;如果是把不符合意義的資料留下來,叫愚蠢。 大資料的主體價值在於把人的目的和意義的保障系統加以專業化(準確說是把手段與目的校準,保障做事不忘宗旨這件事專業化)。 做事情的意義,無非來自兩個方面,或者是老闆指示目標;或者是目標本身,即最終消費者的滿意與不滿意。
按這個標準衡量,大資料發展到今天的水準,還很少有哪家達標。 大資料要真想讓付錢的人心動,還需要把大資料發展到更高階段。 好的跡象是,位列第1的IBM,至少在大資料綱領上,已明確了「智慧」這個主題詞。 說明他從100家中脫穎而出,第一個想明白了,通過風動、幡動,到底要讓人心動,還是心不動。