大資料的未來:機器人的世界,還是人類的機器世界?

來源:互聯網
上載者:User

人類從未對自己的認知能力滿意過。 也正因為此,過目不忘,一目十行,上知天文下知地理,一直被看做是人類進階版本的一個典範。

電腦早就做到了這一點。

最近,在阿裡巴巴的資料開放日中,我會面了數位資料科學家。 當他們描述大資料未來能力的時候,我就會想到人類的局限。 認知科學的未來,必然是電腦與人類的完美結合。 但是,這個結合,應該是什麼樣的?

資料越來越多,而人類的解讀能力是固定的,人會累,會無法完全理性。 但是電腦不會。 電腦可以説明人類找到自己的盲點。 IBM Watson實驗室的首席工程師Bowen Zhou告訴我,在Watson的醫療專案中,人類要閱讀十年的論文,電腦只需要30分鐘就可以讀完。 曾任職Axciom的徐玲告訴我,在非常早期的時候,美國兩個很大的圖書館,以及梵蒂岡圖書館的資料化已經完成了。

這兩件事都指向一個結論:當我們找到的科技能力,正好能彌補人類的缺點,這之間隱藏著巨大的價值。 實現的關鍵在於資料化。 資料化讓電腦和人類得以溝通和結合。

記憶力一直不是人類最關鍵的東西,甚至說,是最薄弱的一環。 邏輯,才是人類的認知關鍵,邏輯的產生源于經驗的積累和推演。 如果電腦能夠説明人類獲取更多的經驗,將有助於更強大邏輯的產生。

我曾經非常喜歡Evernote這個應用軟體。 它可以記錄我所有片段的思考,同時收藏資料和文章。 如果有一天,這個軟體可以通過「機器學習」我的記錄文檔,向我推薦值得閱讀的資料,説明我瞬間搜索資訊,提煉觀點,是否將會改變人類的認知習慣?

未來有可能實現麼? 至少眼下,我們已經看到了一些進展,資料正在説明我們看到盲點。 我總結了資料開放日中各路英雄的核心觀點,希望能夠對你有所啟發。

NO 1 認知科學可能是未來很關鍵的能力

未來資料的價值不在於多少,而在於你是否有提煉的能力。 Watson正在推進的健康專案中,電腦能夠做到通過大資料來判斷未來治療的癌症方向,並且就此判斷更為精准的治療方法。

以往我們是怎麼做的呢? 我們成千上萬的醫療專家,通過閱讀和研究大量的文獻、實驗和試錯,推演出可能的方向。 這需要消耗十年,甚至更長的時間。 而電腦只需要三十分鐘就可以閱讀完所有的相關文獻,迅速判斷有用資訊。 這是用認知科學來節省人類在醫療方面的時間和精力。

NO 2 紅酒與壽司:整合「即時資料」與「歷史資料」

將「即時資料」與「歷史資料」整合已經成為了業界共識。 徐玲這樣比喻說,「歷史資料」如同紅酒,越陳越好。 「即時資料」如同壽司,越新鮮越好,兩者搭配,乃是絕妙。

而今我們對資料的處理上,也需要面對「即時資料」和「歷史資料」結合的問題。 舉個例子,如果你在淘寶搜索茶葉,推薦系統應該從歷史資料中推薦各式茶葉,還是應該結合當前你的購物車資料,推薦更適合你的偏好品牌?

資料的結合並不容易,不僅要求不同資料的格式和標準統一化,更要求對於歷史資料與新資料結合後所產生對當下的理解和認知。

「就像是開飛機,我們通過歷史資料來判斷航道,但當時的風和氣候都很重要對駕駛有影響。 即時資料越對你敏感,就價值越高。 最終你通過設定預期軌跡和即時調整,獲得了最安全高效省錢的結果。 即時和歷史資料的結合意味著更好的計畫和更快的反應。 」

NO3 大資料也需要人的互補

Aaron Ling是Ancestry公司的總工程師,他在論壇上畫了一個巨大的家族譜系圖。 這就是他正在做的專案,用大資料來清晰美國的家族圖譜。 人們通過網站查閱相關的家族譜系,然後通過UGC的方式給出修改或者添加資料。 這個模式將可能會對未來的醫療以及社會研究產生巨大的影響。

這個專案證明了大資料推演出的結果有時候也需要人的互補。 因為經過人的資訊互動,才有可能產生超出于人類的東西。 人的互動可以讓大資料變得更靈活,更實在。

在實際操作中,我們可能會遇到這樣的情況:儘管你擁有很多資料,但是你還是無法獲得某個人的完整網路行為資訊。 所以我們需要用一些演算法把這個「資料漏洞」填住。 來自Samsung的演講嘉賓Junlin Hu這樣形容這種困惑:「如果我們把人看做一個個的列,你會發現每個人其實沒買多少東西,大部分商品和人之間的連接是空白的。 」

也因此,當我們在使用資料的時候,會發現大資料中有很多的漏洞,資料多而稀決。

在這種情況下,我們只能用演算法解決,或者用「人為操作」的方式解決。

NO 4 到底未來是AI世界,還是IA世界

IBM 沃森實驗室的技術負責人Bowen Zhou在會議中提到了一個概念,從AI到IA的轉移。 一直以來,IBM致力於創造能夠媲美人類智力的機器人,比如「深藍」,比如「沃森」。 而現在,他們認為以人類為中心,強大協助工具的電腦可能更有市場。

AI與IA的區別在於,前者以計算為中心,後者以人類為中心。 就是說未來是「機器人的世界」,還是「人類的機器世界」? 佔據主導地位的是會思考的機器人,還是輔助人類的機器?

未來的谷歌眼鏡,可能可以讓我們看到很遠,立即回饋三百公里以外的資訊,但是他不是機器人。

又或者人可以擁有強大的機械手,很厲害的汽車、飛機。 但是他們以人類而不是以機器為中心。 這兩者的區別,是值得思考的。

或者,我們可以這樣問自己一個問題:我們追求的是自動化還是智慧化?

編者按,本次文章的觀點總結者是:

車品覺:中國資訊協會大資料分會副會長

文章內涉及的幾位專家,依次為

Bowen Zhou:IBM Watson實驗室的首席工程師,在統計機器翻譯(Statistical Machine Translation,SMT)領域有深厚積澱;

徐玲(Elizabeth Xu):曾任職Acxiom集團副總裁,是經驗豐富的成熟的管理者;

Aaron Ling:Ancestry公司總工程師(Senior Director of Engineering );

Junlin Hu:Samsung公司的資料總監(director of data mining)。

(責任編輯:mengyishan)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.