大資料與使用者隱私難以兼顧
阿裡巴巴創始人馬雲說:「使用者沒搞清PC時代的時候,移動互聯網來了;沒搞清移動互聯網的時候,大資料時代來了。 」他的話很好地佐證了2013年以來「大資料」一詞在業界的熱度。
不可否認的是,一直被宣揚的大資料時代似乎真的到來了。 在眾星捧月的光環下,「大資料」如同一個香餑餑,人人都想分一杯羹。 那麼,大資料真如我們想像的那麼美好?
筆者以為,在資訊時代的今天,對浩瀚繁雜的資料進行整理判斷是有必要的,資料中也確實存在大量的寶藏。 但是,這就好比在垃圾場拾寶貝一樣,垃圾永遠都比寶貝多。
很多時候,我們無法判斷資料的真實有效性,這對最終的判斷是一種莫大的傷害。 當資料來源不當時,這又是對使用者隱私的一種傷害。 企業需要在利用資料盈利的同時注意不窺探使用者隱私,很多時候,很難掌握那樣一個平衡點。
在生活中,「髒資料」無處不在,舉一個例子,網路水軍的存在就極大影響了互聯網資訊的真實。 一款產品,他的價值和品質是成型的,就擺放在那裡,但是對它的評價卻可以千差萬別。 按照統計學原理來講,評論的基數越大,最終得到的結果就越接近于真實,但是它的前提必須是使用者真實客觀的回饋。 但是在網路水軍存在的情況下,這個條件是不被允許的。
比如,一部低品質的電影被推上市場,因為行銷手段的成功,上座率也很高,在電影網站的評分也很高。 但是這並不是真實的資料,大量的水軍淹沒了資訊的真實性。 如果對資料不加分析評判而直接使用,無論計算精度多麼高,結果都是無意義的,因為資料本身就存在問題。
類似的例子還有,淘寶賣家刷鑽,微博僵屍粉絲,貼吧論壇行銷貼等等。 髒資料在網路中無處不在,在大資料還不成氣候的今天,其實還沒有十分有效的方法對「髒資料」加以鑒別。
大資料的四大缺點總結
大資料只能發現過去,不能左右未來
在資訊時代,每一個Byte中都藏有不可思議的資料資訊,對這些資訊加以歸納整理,提煉出有效的資訊,來説明公司或企業做出更好的決定,正是「大資料」的意義和目的所在。 但是問題也隨之而來,除了上文筆者提到的「資料真實性」以及「髒資料」的問題之外,還有一個很重要的問題就是,市場是變化無常並且不可預期的,決策者的創造性思維並不能通過資料得以體現,相反,資料在壓制創新。
最顯而易見的例子,就是手機廠商摩托羅拉和諾基亞。 在新世紀初,摩托羅拉V3系列手機大獲成功,號稱銷售達1億部,一度傲視群雄。 摩托從大量的資料和回饋中得到了利好消息,認為應該就需在V3機型上下文章。 但是千篇一律、缺乏變化的東西只會讓消費者厭倦。 諾基亞在2007——2010年得業績可以說是如日中天,塞班系統可以說是一統天下,無論資料上還是場面上,都大占上風。 但問題是,一般消費者其實對自己的需求也不太清楚,只有當真的產品出來時,他們才會發出驚訝的讚歎,轉頭就把舊產品扔在一邊。 所以不久之後,塞班就被ios和安卓這些「新勢力」攻城掠地,打得潰不成軍。 如今,摩托羅拉和諾基亞已經分別被谷歌和微軟收購。
在一個新的領域內,擺在第一個開拓者面前的其實是一馬平川,沒有什麼資料可循,也沒有什麼經驗好參考,一切都在摸索中起步。 在這樣的場景下,大資料完全沒有作用,甚至有可能發揮反作用。 一個明顯的例子,Facebook大獲成功之前,互聯網巨頭們的資料分析結果統統認為社交網路沒有大的機遇,Facebook成功後,巨頭們的想法和原先完全相反。 為此,谷歌公司CEO施密特前幾日在採訪中還談到:「我在Google犯的最大錯誤,就是沒有(讓Google)在網路社交興起的時候參加進來。 」
綜合以上,筆者認為大資料主要有以下幾點弊端:
1.資料轉化率低
2.存在隱私安全問題
3.資料真實性有待檢驗
4.資料對創新沒有參考價值
總結:大資料的價值應該被認同,而不是誇大。 現階段的大資料只是一張畫上的餅,離能吃還很遙遠。 大資料不是萬能的,不要迷戀大資料。
(責任編輯:蒙遺善)