《大資料時代》暢銷以來,大資料贏得了難以想像的關注度

來源:互聯網
上載者:User
關鍵字 精細化

自從舍恩伯格的《大資料時代》暢銷以來,「大資料」贏得了難以想像的關注度。 但同時,從實務的角度來看又有一點難以落地的感覺。 這其中的原因,在於很多公司仍然沒有建立起資料的收集到應用的基礎設施包括工具和人才配置,尤其是在實戰層面上未對大資料有較為客觀和理智的認知,吹捧它的人認為它無所不能,在各種場合反復講解一些高大上的案例, 而質疑它的人則認定現有結構化資料就能說明關鍵問題,從而對其不以為意。 事實上,大資料的應用既不便宜,也存在一定的缺陷,更未能充分提升商業的價值,反而大資料其實更需要企業家、產品經理等管理精英們的創造性思維,用資料的力量做出確切的關聯和相互參照,使大資料能真確地產生物有所值的商業效應。

不要迷信大資料

幾乎每個禮拜,我都要面試很多資料科學家,以及不少從業者。 例如,在招聘時,我問應聘者的第一個問題一般都是「在你心裡什麼是大資料」。 回答顯示,原來業內的認知分歧絲毫不比外行少——至少有一半受訪者或應聘者對「大資料」這個概念根本就不以為然,而是更關注有價值的資料、資料能產生什麼價值。 換言之,在部分人看來,「大資料」本身就是一個偽概念。 我問的第二個問題是,目前為止,你做得最好的大資料案例是什麼? 他們的回答都有個共同點,就是用大資料來處理資料的稀缺性。 比如,北京的空氣品質監測站是有限的,其資料對於監測站附近範圍的品質呈現是比較準確的,但其餘地區的品質資料是非常稀缺的。 換言之,大資料能幫我們增加未知部分的準確度、精確度。

有很多人討論大資料與小資料的關係。 其實,這個問題衍生自大資料如何落地。 應該說,大資料可以說明商業運營者找到大致的方向,但真正落地到商業操作,反而不如小資料更有用、更有效。 比如,很多運營者宣稱自己的註冊使用者是多少量級的,但是1億個註冊使用者的基礎資料,不如一千萬個活躍使用者完整的行為資料更具有價值。 對於初創企業進行客戶探索、發現和驗證時,幾百個甚至幾十個顧客、使用者的完整資料比你得到千萬級資料更有價值。 也許正是因為資料量雖大,但每個資料單元都出現了斷裂或遺漏,導致大資料的價值難以被挖掘出來。

因此,應用大資料的能力之一就是把資料變小的本領。 在構建資料模型時,你需要的樣本其實不是千萬,甚至不是面面俱到的資料,而是比較敏感的資料指標。 這對資料收集和分析人員是巨大的挑戰。 實際上,大資料的應用和落地,也要以資料的細分為基礎。 例如某電商顧客的真實性別就不一定與購物的性別偏向一致;再比如,關鍵字搜索量,看北京、南京各多少,而不是籠統地說增長了多少。 當我們用放大鏡細查大資料時,會發現有不少的「斷鏈」和資料欠完整。 從某種意義上說,大資料沒有真正的全面資料,差別只在於你放大鏡的倍數。 即使基於大資料進行決策,也仍然有猜測和賭博的成分在其中。 所以,我反而主張,大資料和小資料應該可以互為作用,而非比較兩者誰更強。

目前,大資料應用裡有個怪現象,就是有什麼資料就收集什麼資料,至於將來有什麼用,一概不知,或者抱著「先收集再說,將來總有用」。 我的建議是,從問題、願景導向來收集資料。 一方面,資料的收集、存儲備份等成本都不低,另一方面,資料的價值也可能衰減。

其次,在我看來,以使用者為核心的KPI能實現與客戶的行為點對點連通,是未來發展的大趨勢。 傳統的使用者價值是以利潤貢獻為核心指標來衡量的,而在大資料時代,客戶關係的管理可能就不一樣了。 例如,我要知道一個客戶一個月內到淘寶多少次,不管他是否購買,要看他與我們公司的關係到底怎麼樣。 同學舉行婚禮,禮金重才是好哥們? 顯然不是這樣的。 一個禮拜,使用者花在視頻網站、微博等等的時間是多少。 未來競爭的是使用者的注意力。 在大資料的創新下我們是否可以更容易得知你得到了多少的使用者注意力呢。

公司要建立起資料收集系統,更重要的是要建立起跟蹤資料品質的監控,而且一些關鍵資料要尋找多個源頭,一方面確保「雞蛋不在一個籃子」,另一方面要相互比對、印證。 對於實際運營的企業來說,資料必須有連貫性,而且要確保資料的真實性,因為如果資料的收集或獲取本身就錯了,那麼後邊的分析和決策無疑就建立在沙灘之上,「根基不牢,地動山搖」。

就現狀而言,大資料技術更多地用於推薦和行銷,不是因為它更容易,而是因為它容錯的空間更大。 比如,推薦系統給出了顧客不喜歡的推薦,大不了重新推薦,但一旦上升到直接解決問題層面,其容錯空間就大大縮小了。 例如,利用大資料技術來觀測空氣品質,錯了也不會有大的影響,然而如果把這個指數和某個商業運營掛鉤,就不是小事了。 更何況如果資料是用在一部無人駕駛的汽車上,不准確地運用資料的後果更是不堪設想。 人們很喜歡談論沃爾瑪「啤酒與尿布」的故事,但是其相關性只發生在週五下班後,而且一年後這個關聯不再出現了,因此,需要資料部門的不斷跟蹤,不能一條經驗法則走到黑。 尤其是對資料的精確性要求較高時,資料的持續跟蹤與多源比對就顯得非常重要。 也正是這個原因,導致大資料的應用還停留在比較膚淺的層次或者壓根就飄在空中。

作為創新的賽馬場

有人認定大資料具有前景,於是試圖利用先前收集的資料開創新的事業或業務,但目前為止我還沒有看到特別成功的例子。 相對而言,在擁有大資料的公司之內應用大資料比沒有大資料的公司可能要容易一些。 其優勢是,他們對資料比較熟悉,知道其中的資料定義和資料搜集中的難點和局限性,從而比外部合作者用得要好。 當然創新是否容易被舊有文化所限制,又另作別論。 阿裡金融的成功,是在游離母體與靠近母體間找到了一個動態的平衡,克服了外來資料所帶來的困擾。 例如,產品設計改版使得資料變化了,但資料生產方卻未必有告知的義務。 因此,資料消費者要監控資料來源是否穩定。 這也與資料公司的既有文化和業務範疇有關,一家善於構築堡壘的公司即使有無可比擬的資料資源,很可能寧願等著資料價值的衰減,也不願意將其有效利用。

其次,應用大資料開創新業務的能力問題,許多業務運營者可能搜集了大量的資料,但能否挖掘出「原業務」以外的創新性業務,到目前為止仍然是一個巨大的挑戰。 商業創新有時候表現為不可思議的關聯,但總體而言,由於這種突破性的關聯帶來創新業務的概率是非常小的。

傳統企業怎麼辦

到目前為止,我們在談論大資料的時候,在根本上忽略了一點,很多企業本身是有其架構的,不會因為大資料就立即變得不一樣了。 很多公司連資訊(information)都未打通,是堵塞、零散的,更不要說大資料的應用了。 大資料作為一種新的運營理念和方法體系,要想嵌入到公司裡,必然要經歷一個新事物在舊公司的所有困難。 比如,想要的資料無法採集,很多公司口口聲聲說「以客戶為中心」,但關於客戶的資料要回流到公司核心決策裡卻不容易,其統計口徑與企業KPI不一致。 這些雖然與今天我們所說的大資料沒有關系,是資料化,卻是大資料的基礎。 如果在一家公司裡,想要看的資料沒搜集,或流動不順暢,卻被大資料所迷惑,那是本末倒置。

但這不是說,傳統企業可以對大資料應用置若罔聞。 對當下的企業來說,要反躬自問,有沒有一些資料,今天不搜集,將來會後悔? 如果這些資料被對手搜集到,會怎麼樣? 要做到這一點,就要對公司一年後、兩年後或半年內的方向非常清楚,或者至少有個概念。 實際上,我們的互聯網上充斥很多與企業相關的資訊或資料,但未得到足夠的重視,這主要是觀念問題,而不是能力問題。

今天人們所說的資訊技術(IT),其實越來越趨向于資料化,商業智慧要把銷售資料、行銷資料和消費者資料打通,而不是各自孤立。 傳統企業高管應該重視資料的關聯應用,至少不能只滿足于財務報告的資料,不要容忍人力資源部連主動離職率與服務水準都關聯不起來洞察。 要有步驟地構建起資料的搜集系統,培訓對資料高度敏感的人員。 當然,從一種有效的策略來說,先把既有的資料用好,比盲目推進大資料要明智得多。 你要重新定義你的資料框架來解決存在的問題。 比如,很多企業都開啟了公司微博,其測定效果是轉發多少、評論多少。 但實際上,你要細分你的資料,進一步厘清誰、什麼樣的轉發和評論才是有價值的,還要和相似的公司微博進行對比。

傳統企業究竟是建立起自己的獨立的搜集系統,還是使用別人提供的資料? 我認為要兼有,既要有側重地獨自搜集,也要多源化地獲取資料,盡力排除各種資料在搜集過程中形成的偏差,這既是一個技術問題,需要資料人員付出艱辛的努力,也是一個戰略問題,需要回到前文所述的小資料問題。

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.