通常,對於新的IT關鍵字必定會出現「反對派」。 最近,「大資料」就成為被攻擊的物件,諸如「大資料失敗論」等論調也明顯增加。
業界對大資料抱著極大的期待,這一點從大量HTTP://www.aliyun.com/zixun/aggregation/14294.html">的大資料研討會和展示會風潮就足以證明。 這些年來,除了雲計算浪潮,缺乏熱烈話題的IT業界而言,大資料是期待已久的大型關鍵字,也許大資料會成為恢復業界活力的強心劑。
與此同時,日本政府提出新的IT戰略--「將行政資料向民間開發,以便不斷創造新商務」。 也就是說,如何有效利用資料,推動商業成功,業已成為國家戰略的一環。
雖然筆者既不是強烈的贊成派也不是反對派,但通過以往的採訪經驗,對處理資料的難度有著清醒的認識。 更何況涉及到大資料,其難度顯而易見。
筆者周邊很多人對大資料也有著各種不同的看法,提出各種問題。 當然這些對於IT業界的讀者而言,都是理所當然的事情,筆者說這些也許是班門弄斧了。 但是,正是這些眾所周知的道理通常也是非常重要不可忽視的。 因此,下面筆者將重新提出大資料的「陷阱」,探討如何才能避免運用大資料的失敗。
是否真正需要大量的資料
首先,必須明確的一點是,是否真正需要大量的資料。
在一次活動中,一位統計分析的專家在談到大資料時說:「本來統計分析學是如何通過少量的取樣,去瞭解事務整體的學問。 例如,電視的收視率調查就是一個典型的事例,這類調查就是通過極少的樣本,來掌握日本全國的收視狀況。 如果目的明確,並不需要大量的資料。 」
由於上述言論出自目前作為「資料科學家」備受矚目的統計分析方面的專家之口,讓筆者不禁大吃一驚。 這就是說,只要有一定量的資料,無關資料數量,分析的結果並不會有很大的差別。 如果果真如此,不禁讓人產生懷疑,即到底大資料是為何而存在。
聽到上述觀點,使人感到大資料所面臨的矛盾的應當不僅僅是筆者一人。 本以為通過大資料分析,滿懷期待能夠發現以往沒有認識到的新的東西,但有時其結果不過是已有所知的事實而已。 如果企業為系統開發投入數十億日元,得出的不過是證明資深職員「經驗」的結論,這也未免讓人難以接受。
正因為如此,就有必要重新考慮為何需要大資料這一問題。 例如,企業需要明確通過將有交易往來的公司和社交媒體等本企業外的大量資料進行組合,是為達到何種目的等,即有必要事先制定大資料的目標。
資料的「品質」有無問題
第二點是由誰來維護大量的資料,即資料的「品質」如何能夠得到保障。
筆者曾聽說這樣一件事。 某企業的總經理每個月都會收到有交易往來的IT供應商的宣傳(PR)雜誌,但收件者的頭銜不是「總經理」,而是他曾經兼任公司CIO時的頭銜「常務董事」。 雖然將頭銜搞錯,但還是都能收到,因此並沒有太在意。 但當這家IT供應商的總經理到公司進行禮節性拜訪時,就提出了希望改一下頭銜的想法。
而這家IT供應商的新的賣點是大資料,公司的總經理當場表示回去馬上會進行修改。 起初以為這點事情對於運營大資料業務的IT供應商而言不過是舉手之勞,一定會進行糾正。 但是,等到下一個月他收到的的PR雜誌時,發現收件者的頭銜仍然是「常務董事」。 這位總經理通過兩本PR雜誌感到仿佛看到了大資料的現狀,因此他非常失望地說:「歸根到底IT供應商並沒有維護顧客資料庫」。
上述例子雖然是顧客資料,而不僅僅是顧客資料,說到大資料必然還需要處理很多各種各樣的企業外部的資料。 但是,這些資料是否是最新資料,其資料的精確度又如何等資料的「品質」就會非常重要。 分析出處不明的資料將毫無意義。 如果顧客資料不能隨時進行維護,也就不會產生任何價值。 不應當將當初以為是寶山的大資料,變成一座堆滿垃圾的山。
是否忽視了現場職工的工作幹勁
第三點就是企業不僅應當努力培養資料科學家,同時也需要提升現場職員的分析資料的能力。 如果在店頭等現場直接接觸顧客的員工變得「擅長數位」,他們也能夠常常通過資料考慮事情並進行判斷,這樣的企業必定會強大起來。
例如,有一家超市的店頭銷售員就從與顧客的對話中得到啟發,通過購進新的商品或是改變商品陳列的方法,提升了銷售額。 又比如,在特快列車上負責銷售的員工,發現似乎「可吸煙座位的咖啡暢銷」,當他整理出不同列車的銷售業績,結果發現確實是如此。 於是決定在吸煙車廂集中推銷咖啡,結果咖啡的銷售量明顯增加。
當然,通過現場增加的銷售額,也許和利用大資料獲得的銷售數位相比很小,而且其分析能力也遠遠不及資料科學家。 但是即便如此,如果通過將這種方式橫向拓展到其他現場,積累的數位也會非常可觀。 同時,最為重要的是,這種方式能夠提升現場員工的工作動力。
實際上,某零售企業自從將其銷售分析統一由總公司實施後,店頭員工就失去幹勁,甚至出現退職的員工。 這說明只依靠上級的指令,則會降低現場的職業道德。 因此,這家公司決定給予現場員工自由分析判斷的職能,由此店頭又重新恢復了活力。 雖然大資料非常重要,但是如果將許可權集中在某些部門,則會導致現場喪失工作幹勁。
以上三點實際上不僅僅對大資料而言非常重要,而且同時適用于整個資訊系統。 大資料是IT業界期待已久的關鍵字,為使其成長壯大,就需要腳踏實地的努力,而不應被其華麗的部分所束縛擺弄。 正因為如此,筆者認為提出的上述三點需要重新銘記心中。