人類從未對自己的認知能力滿意過。 也正因為此,過目不忘,一目十行,上知天文下知地理,一直被看做是人類進階版本的一個典範。
電腦早就做到了這一點。
最近,在阿裡巴巴的資料開放日中,我會面了數位資料科學家。 當他們描述大資料未來能力的時候,我就會想到人類的局限。 認知科學的未來,必然是電腦與人類的完美結合。 但是,這個結合,應該是什麼樣的?
資料越來越多,而人類的解讀能力是固定的,人會累,會無法完全理性。 但是電腦不會。 電腦可以説明人類找到自己的盲點。 IBM Watson實驗室的首席工程師Bowen Zhou告訴我,在Watson的醫療專案中,人類要閱讀十年的論文,電腦只需要30分鐘就可以讀完。 曾任職Axciom的徐玲告訴我,在非常早期的時候,美國兩個很大的圖書館,以及梵蒂岡圖書館的資料化已經完成了。
這兩件事都指向一個結論:當我們找到的科技能力,正好能彌補人類的缺點,這之間隱藏著巨大的價值。 實現的關鍵在於資料化。 資料化讓電腦和人類得以溝通和結合。
記憶力一直不是人類最關鍵的東西,甚至說,是最薄弱的一環。 邏輯,才是人類的認知關鍵,邏輯的產生源于經驗的積累和推演。 如果電腦能夠説明人類獲取更多的經驗,將有助於更強大邏輯的產生。
我曾經非常喜歡Evernote這個應用軟體。 它可以記錄我所有片段的思考,同時收藏資料和文章。 如果有一天,這個軟體可以通過「機器學習」我的記錄文檔,向我推薦值得閱讀的資料,説明我瞬間搜索資訊,提煉觀點,是否將會改變人類的認知習慣?
未來有可能實現麼? 至少眼下,我們已經看到了一些進展,資料正在説明我們看到盲點。 我總結了資料開放日中各路英雄的核心觀點,希望能夠對你有所啟發。
NO 1 認知科學可能是未來很關鍵的能力
未來資料的價值不在於多少,而在於你是否有提煉的能力。 Watson正在推進的健康專案中,電腦能夠做到通過大資料來判斷未來治療的癌症方向,並且就此判斷更為精准的治療方法。
以往我們是怎麼做的呢? 我們成千上萬的醫療專家,通過閱讀和研究大量的文獻、實驗和試錯,推演出可能的方向。 這需要消耗十年,甚至更長的時間。 而電腦只需要三十分鐘就可以閱讀完所有的相關文獻,迅速判斷有用資訊。 這是用認知科學來節省人類在醫療方面的時間和精力。
NO 2 紅酒與壽司:整合「即時資料」與「歷史資料」
將「即時資料」與「歷史資料」整合已經成為了業界共識。 徐玲這樣比喻說,「歷史資料」如同紅酒,越陳越好。 「即時資料」如同壽司,越新鮮越好,兩者搭配,乃是絕妙。
而今我們對資料的處理上,也需要面對「即時資料」和「歷史資料」結合的問題。 舉個例子,如果你在淘寶搜索茶葉,推薦系統應該從歷史資料中推薦各式茶葉,還是應該結合當前你的購物車資料,推薦更適合你的偏好品牌?
資料的結合並不容易,不僅要求不同資料的格式和標準統一化,更要求對於歷史資料與新資料結合後所產生對當下的理解和認知。
「就像是開飛機,我們通過歷史資料來判斷航道,但當時的風和氣候都很重要對駕駛有影響。 即時資料越對你敏感,就價值越高。 最終你通過設定預期軌跡和即時調整,獲得了最安全高效省錢的結果。 即時和歷史資料的結合意味著更好的計畫和更快的反應。 」
NO3 大資料也需要人的互補
Aaron Ling是Ancestry公司的總工程師,他在論壇上畫了一個巨大的家族譜系圖。 這就是他正在做的專案,用大資料來清晰美國的家族圖譜。 人們通過網站查閱相關的家族譜系,然後通過UGC的方式給出修改或者添加資料。 這個模式將可能會對未來的醫療以及社會研究產生巨大的影響。
這個專案證明了大資料推演出的結果有時候也需要人的互補。 因為經過人的資訊互動,才有可能產生超出于人類的東西。 人的互動可以讓大資料變得更靈活,更實在。
在實際操作中,我們可能會遇到這樣的情況:儘管你擁有很多資料,但是你還是無法獲得某個人的完整網路行為資訊。 所以我們需要用一些演算法把這個「資料漏洞」填住。 來自Samsung的演講嘉賓Junlin Hu這樣形容這種困惑:「如果我們把人看做一個個的列,你會發現每個人其實沒買多少東西,大部分商品和人之間的連接是空白的。 」
也因此,當我們在使用資料的時候,會發現大資料中有很多的漏洞,資料多而稀決。
在這種情況下,我們只能用演算法解決,或者用「人為操作」的方式解決。
NO 4 到底未來是AI世界,還是IA世界
IBM 沃森實驗室的技術負責人Bowen Zhou在會議中提到了一個概念,從AI到IA的轉移。 一直以來,IBM致力於創造能夠媲美人類智力的機器人,比如「深藍」,比如「沃森」。 而現在,他們認為以人類為中心,強大協助工具的電腦可能更有市場。
AI與IA的區別在於,前者以計算為中心,後者以人類為中心。 就是說未來是「機器人的世界」,還是「人類的機器世界」? 佔據主導地位的是會思考的機器人,還是輔助人類的機器?
未來的谷歌眼鏡,可能可以讓我們看到很遠,立即回饋三百公里以外的資訊,但是他不是機器人。
又或者人可以擁有強大的機械手,很厲害的汽車、飛機。 但是他們以人類而不是以機器為中心。 這兩者的區別,是值得思考的。
或者,我們可以這樣問自己一個問題:我們追求的是自動化還是智慧化?
編者按,本次文章的觀點總結者是:
車品覺:中國資訊協會大資料分會副會長
文章內涉及的幾位專家,依次為
Bowen Zhou:IBM Watson實驗室的首席工程師,在統計機器翻譯(Statistical Machine Translation,SMT)領域有深厚積澱;
徐玲(Elizabeth Xu):曾任職Acxiom集團副總裁,是經驗豐富的成熟的管理者;
Aaron Ling:Ancestry公司總工程師(Senior Director of Engineering );
Junlin Hu:Samsung公司的資料總監(director of data mining)。
(責任編輯:mengyishan)