大資料,是近幾年內最為熱門和重要的技術話題。 8月31日,百度百家舉辦的第三期BIG,請來了可穿戴設備和大資料領域享有盛譽的世界級權威教授Alex Pentland,與百度百家共同探討大資料和可穿戴設備的未來。 Alex Pentland直言他在生活中並不怎麼使用可穿戴設備,因為現在技術和應有都不太成熟,這種判斷我也很認同,下文中我們將重點討論大資料話題的討論上。
大資料的價值是否被高估了?
現在單純地討論大資料是沒有現實意義的,它必須跟雲計算相結合才能發揮出應有的作用。 完整的大資料應用應該包括資料獲取、存儲、分析、應用等環節。 現在用瀏覽器訪問新浪網,首頁中間部門跳出的京東商城廣告,總是非常巧合地符合你的心意,這其實就是大資料的具體應用。 通過採集使用者近期的購物習慣和搜索內容,給出非常有針對性的商品促銷廣告,這種針對性精准的廣告自然會帶來更強的購買轉化率。 大資料的意義非凡,它將是未來商業非常重要的組成部分。
但有學者提出,大資料將是未來最重要的生產資料。 也有廠商更是提出了「資料星球」的響亮口號,但就我的觀察來看,大資料具有非常明顯的兩面性,某些大資料是十分重要而且有價值的,但絕大部分離散的資料是無用的;挖掘大資料一方面可以產生高價值,但也可能給企業帶來沉重的成本負擔。 我們通常看到的是大資料的正面意義,但用放大鏡看看它的反面會有不一樣的收穫。
人類歷史每一次生產力產生重大突破,針對核心生產資料的爭奪都會引發劇烈爭端甚至殘酷戰爭。 至今,人類對石油資源的爭奪,還是引發局部戰爭的重要原因。 但現在還沒有跡象表明,人類將為爭奪大資料的控制權而發生戰爭,所以在某種程度上來說,目前大資料還沒有達到最重要生產資料的戰略高度。
IT產業在技術發展的過程中,技術新概念是從未間斷的。 大資料概念的提出,離不開互聯網深入滲透到各個行業的現實背景,資料量突增、資料種類繁雜、有用的資料甄別和挑選越來越難,這些問題都在困擾著使用者,所以也自然而然地誕生了巨大的商機,這便是IT廠商熱衷於大資料概念和業務的根本原因。
離散的靜態的資料本身並沒有太多價值,只有通過有效的手段提煉、分析,才能夠讓大資料點石成金,所以在大資料產業的生態鏈中,真正有價值的是資料提煉、挖掘和分析,而不是資料原型本身。
大資料是未來商業的核心?
我過去在微薄上看到了一個企業發佈的應用案例,說一個鎮的銀行行長說「選址、選人都還是小事情,最大的問題就是IT系統的建設。 」他們選擇了某企業的IT解決方案之後如何如何。 我在這則微薄後的評論是:這是個失敗的宣傳案例,因為不真實,沒存款沒客戶才是小鎮銀行最要命的,IT建設很重要,但也別拔高到脫離現實的程度。
這是一種極普遍的現象,IT廠商在宣傳成功案例時往往將IT建設描述成仙藥,但其實IT系統的建設就是提升效率、規範業務流程的工具和幫手而已,商業客戶在生意中最為重要的資源優勢、商業模式等核心競爭力, 其實都不是建一個IT系統能夠取代的。 我買一雙運動鞋時最為看重的是舒不舒服,而選擇去哪吃午飯主要考慮的是哪家店味道好、乾淨放心,雖然這些生意達成的背後,耐克或者KFC所建設的IT系統發揮了作用,甚至起到了線上直接導流客源的作用,但對於消費者來說, 是否能成為回頭客再次光臨,那些IT系統並不是關鍵所在。
所以,大資料服務商應該對自己的有更清晰的定位,那就是盡職的業務流程服務商和助手,而並不能搶鏡去當人家業務流程中的主角。
大資料產業要想真正爆發,需要讓大多數企業嘗到大資料的甜頭,借助大資料技術説明他們找到更多使用者、賺到更多錢,他們才願意投入更多資金和資源,這才有可能形成良性互動。
但現在大資料的受益者主要來自于IT技術水準高超的互聯網企業或者IT企業,大多數行業還沒有在大資料浪潮中收穫真正的商業價值。
沙子並不重要,重要的是淘金術;資料本身並不能直接產生價值,挖掘、分析、應用環節,才是資料價值集中體現的環節。
大資料回避不了的成本問題
對於一個上馬了EPR系統的大中型企業,那麼很可能每個月要面對數以TB級別甚至更大容量的業務資料增量,企業也要為此支付高額的大資料存儲、備份、安全防禦的開支。
我們一方面要認識到,資訊系統的上馬會大幅度地提升資訊流的傳遞和分享,有助於業務流程的效率提升,但在另一方面也在加大了企業的成本開支。
有人做過一個形象的比喻,有價值資料就像沙子中的金粒,稀少而珍貴。 很多企業的資料備份則像是為了留下這些金粒,而建設了足以裝下大沙堆的超大倉庫。 我想將這個比喻引申一步,那就是做大資料解決方案的廠商因為幫你存下了沙子,從你手裡拿走了金子;而你淘遍了整個倉庫沙堆得來的金子,很可能比你花出去買沙子的還多。 如果你沒有很好的煉金術,請別花那麼多錢建倉庫,也沒必要存那麼多沙子。
在專業的大資料存儲和備份市場,去重率和壓縮比都是很重要的指標,但到了真正的專案實施中,因為有用資料夾在大量的無用資訊之中,使用者往往在資料存儲的過程中花了大量的冤枉錢。 針對資料的挖掘可以產生巨大的商業價值,但同時大量的無價值資料也會耗費大量的成本,所以我們應該對大資料有個投入產出的概念,而不能只關注大資料可能產生的效益,而忽視了大資料的成本問題。
大資料有時是易碎品和危險源
在IT企業大力宣傳雲計算和大資料價值的時候,其實是沒有幾個廠家敢拍著胸脯說我能100%保證資訊安全問題。
在今年春天舉辦的中國雲計算產業論壇上,國內資訊化專家曾經明確指出,政府等對資訊安全敏感的客戶,絕不能使用公有雲。 所以對那些對安全性要求極高的客戶而言,大資料帶來的安全隱患也足以讓他們對大資料應用望而生畏。
用專業存儲備份和資訊安全軟體,可以在很大程度上降低資料發生損壞和失竊的概率,但只是概率降低而已。 我非常看好大資料超市,它未來會是IT產業中利潤最豐厚的一塊蛋糕。 因為原始的大資料是脆弱而易於受到攻擊的,我們多數人和多數企業,都需要花更多的錢來保護它。
大資料是未來極為重要的技術手段,它有可能對現有的商業社會產生重大的影響。 但我認為短時間內,大資料並不會成為現代商業社會的核心要素,也不會成為最重要的生產要素。 就如同微薄上的雨夜求助資訊,可以讓很多人知道你在三元橋需要車輛援助,但真正能把你送到家的是那些那些午夜冒中著巨大被淹風險的熱心市民和那輛涉水受損的車。
你可以觀察一下,現在大談大資料和雲計算的主要是那些廠商,他們如此熱衷,是不是根本目的就是為了多賣幾台高性能伺服器或者網路設備?
人,是現代生活的主角,而大資料只是人類活動的衍生物而已,雖然《駭客帝國》中對此有疑議,但起碼在我觀察到的世界和維度裡是這樣的。