今天迎來了第三期Big Talk,繼第一期邀請HTTP://www.aliyun.com/zixun/aggregation/1806.html">尼葛洛龐帝,第二期邀請拜倫森之後, 本次邀請的主講人是被譽為可穿戴設備教父,大資料頂級專家亞曆克斯,潘特蘭,主題為「大資料建設更好的世界」。
作為在上世紀90年代就提出可穿戴設備概念的潘特蘭教授,在大資料方面也享有卓著聲譽,但他對大資料的看法,站在互聯網業者的角度來看略顯保守。 因為他最為人稱道的幾個研究方向並非大資料的應用,而是個人資料採集規則,大資料安全和隱私等。 不過這些在我們眼裡看上去遠比不上大資料發展優先的主題,並不妨礙他成為大資料領域首屈一指的專家。
潘特蘭的學生中牛人輩出,有發明谷歌眼鏡的,也有發明面部識別技術的。 潘特蘭本人則較為熱衷於為大資料獲取和應用制定規則,設立標準,甚至還在9374.html">世界經濟論壇這種重大場合為政治及經濟人物提供各種與此有關的建議,可以看得出,大資料的規則和秩序是他更為看重的主題。 這在當前整個社會對大資料的狂熱情緒下,似乎顯得有些違和,但誰也不敢肯定,幾年後這未必就不是一個至高議題。
與那些喜歡做美食但自己不吃的廚師一樣,潘特蘭作為可穿戴設備教父,自己是不戴可穿戴設備的。 雖然沒有明說,但他對產自IT界的各種可穿戴設備所表現出的鄙夷,還是能夠令人清晰感知到的。 吃飯的時候他曾表達過這樣的意思:不要相信那些現有的可穿戴設備,未來的大資料與之沒有半點關係。 而在現場視頻中對各種市面上常見的可穿戴設備進行測試時,結果也確實與其態度有所吻合,所有加入測試的設備無一倖免地暴露出資料上的偏差,外觀不錯的小米手環誤差率竟然達到了15%。
潘特蘭將這些設備稱之為簡單、劣質,而他自己認可的可穿戴設備標準,則完全以使用者體驗為導向。 他認為,那些設備光是能將人的步速和心跳頻率測出來,本質上是沒什麼用的,使用者需要讓這些設備告訴自己,今天他的身體到底好不好,有沒有什麼欠缺,該如何進行調理等等。 他所說的這種我們從未見過的場景,我想就是可穿戴設備和大資料緊密結合的產物了,很遺憾這種產品目前還沒問世。
大資料的四個階段,採集、存儲、分析、應用,目前的發展水準似乎仍停留在採集階段,但對此已有分歧了。 大公司喜歡把合理訴求和自我訴求巧妙混合在一起,然後拿出來說事兒,他們對資料的渴望是貪婪的,恨不得能採集的都採集到,然後實現資料互通,最終實現產品化和商業化。
但要注意到的問題是,資料獲取和使用仍然是應該有邊界的。 就拿BAT來說,騰訊把聊天記錄作為大資料樣本,阿裡把交易資訊作為大資料樣本,百度把越權抓取的非公開資訊作為大資料樣本,從法理上來說都是存在一定風險的。 個人網上資訊的擁有權在過去並不是個問題,未來一定會是個問題。
潘特蘭為此提出的解決方案,則更顯人性化,基於使用者角度去考慮問題,較少考慮商業因素。 他認為,每個人都有權使用自己的資料,選擇進入或者退出網路,或者選擇是否分享給別人。 只有使用者對資料應用和安全放心了,不覺得會有什麼問題了,才會有真正的大資料。
其實很容易理解這些話的含義,大公司對資料的擷取是主動的,而使用者對資料的被收集則是被動的,這對於一個未來的龐大產業而言,不可能不是一個問題。 英國微電影「黑鏡「中有個場景,在一個人出車禍死後,系統自動搜集此人在各種社交網路上的發言和分享,類似于人肉搜索,然後基於這些資料模仿出其語言,再通過逼真的類比語音,實現與未亡人進行跨陰陽兩界對話的效果。 這個場景相當令人震撼,也相當令人擔憂。
如果大資料應用到這個地步,必然會出現不良後果,這會反過頭來損害大資料產業的發展。 潘特蘭說的那些話意思在於,你讓使用者自己去選擇個人資料的應用,賦予其主動權,這才是對大資料發展更有好處的事情。
例如,使用者如果認為自己的身體資料並沒什麼隱私問題,你給他退出的權利,他會主動給你上傳更多的優質資料,而這些資料是公司們想通過技術手段收集,也收集不來的。 可穿戴設備與這種兼顧了使用者權利的資料結合,才會達到他心目中的理想效果。
其實我一直都有個看法,通過大資料預測未來是一件不靠譜的事情,不管你的應用技術如何發達,IT設備如何高效,這本質上是一種違背能量守恆定律的臆想,如永動機一樣永遠不能實現。 不過,在預測未來之外,大資料可做的事情其實要比我們想像的更多,如石油帶動能源革命一樣,會對未來的人類生活產生重大影響。
這個事情需要有序推進還是野蠻生長,著實是值得深思的問題。 由於資料維度的不同,文化習慣的差異,大資料之間未來發展到應用階段時,會呈現出嚴重的不同步現象,出現失真,解決這個問題的關鍵,在於規則和標準。 而為大資料建立規則和標準,似乎正是潘特蘭教授真正心嚮往之的一件事,因為他知道,這可能會影響到一個革命性產業在未來的走向。