摘要: MDCC 2013移動開發者大會于2013年11月13-14日在北京國家會議中心隆重召開,本屆大會由CSDN和創新工廠聯合主辦。 逾百位國內外移動互聯網領域的領軍人物與核心技術專家,以全民移動,重
MDCC 2013移動開發者大會于2013年11月13-14日在北京國家會議中心隆重召開,本屆大會由CSDN和創新工廠聯合主辦。 逾百位國內外移動互聯網領域的領軍人物與核心技術專家,以「全民移動,重塑世界」為主題,分享最新實踐經驗,探討移動互聯網發展趨勢。 此外,智慧硬體、移動娛樂遊戲、微APP三大主題峰會成為本次大會新亮點。
中國工程院院士李德毅發表了題為《大資料時代的認知計算》的演講。 他分析了認知究竟可不可以計算,並闡述了大資料時代、移動時代,認知計算應該何去何從。 他認為以人為本的認知物聯網的時代已經到來了,大資料時代的認知計算正在逼近認知科學。
以下為演講實錄:
李德毅:各位同行大家好。 移動生活、移動品質,給我們帶來的變化很大。 這一年社會上的人,拿個 手機 ,有說有笑有拍照,這就是給我們帶來的變化。
人活著就要動,移動的速度是多少,把移動速度搞清楚,移動產品才搞得清楚。 我們靠兩條腿動,靠輪子動,靠高鐵動,靠飛機動,主要還是低速移動,所以我們叫移動,不叫運動。 但是背個筆記本是個負擔,所以我就想一想,大資料時代對我們移動生活帶來了什麼變化,也就是大資料時代人的認知,認知最簡單的是說話、聽、看、寫。
認知可不可以計算?
這是一個很古老的命題。 因為老科學家認為人是世界上最高級的精品,比 其他 東西都強,認知是不可計算的。
我們希望提高人的生活品質,我們希望智慧。 說把智慧城市變成智慧城市,智慧是個技術,我們要的是智慧。 我們說你這個良心大大的壞了或者我心情不好學不進去,說明這個認知和心態有關系。 但是作為人工智慧的科學,作為認知科學來說,我們長期以來強調的是智商,腦智,依據現有知識進行分析、聯想、推導或歸納,產生新知。 我們認為人的認知主要靠大腦。
後來說不對,你這個人智商很高,情商太低不行。 面試的時候老闆要通過意象、直覺、想像、情感等進行直觀、綜合的思考,在創新中起著至關重要的作用。 這就是二元。 更多的人說成功等於40%的智商和60%情商的相互作用。 所以認知科學到現在還有很多沒有解讀的地方。
1936年,天才科學家圖靈建立了圖靈機概念,任何形式系統可以通過圖靈機準確刻畫。
老百姓通常把計算工作交給電腦,它是基於人腦的智慧嗎? IBM研究了一個生產電腦。 人們把人的思維能力放到機器裡去,前臺是機器,後臺是人。 從這個意義上,認知應該是可以計算的。
我們的程式問題、停機問題、程式驗證問題本質上是不可以計算的。 所以我們打了補丁還有漏洞。
數學自身是機器程式不可窮盡的。 並不是所有的數學問題都可以用電腦來做的。 所以人腦不能被物化變成電腦,重要是人腦能不能被形式化。 好多諾貝爾獲得者都在這個方面獲得了重大貢獻。 但計算性是不依賴于形式系統的選擇的。
因此,IT工作者千萬不能用行政化的方法來研究思維和意識。 意識怎麼理解? 靈魂怎麼理解? 宗教怎麼理解? 信仰怎麼理解? 它們和思維是什麼關係? 腦裡面有分工,這塊幹什麼,那塊幹什麼,後來研究的成果發現,人的意識和精神活動,是由大腦不同區域共同作用產生的。 怎麼樣才能共同作用,這個問號到現在還很大。
生命科學家喜歡物理,喜歡化學,難道人的思維是由物質和化學規律支配的嗎? 這個令人懷疑。
有人認為,人是不可能自己把自己搞清楚的。 你要研究一個東西,要站在一個東西之外。
大資料時代的挑戰
在這樣的情況之下,自然雜誌登出了一篇重要文章,裡面一個小標題——BD(大資料)時代的科學,我們應該怎麼做,這是我們時代的挑戰。
大資料的來源分為三大塊:
第一塊是地球,我們叫數位地球,自然大資料把我們的地球、宇宙搞清楚。 第二是生命,包括各種動物,尤其包括我們人類,這本身也是大資料。 第三就是社交,互聯網,尤其是移動互聯網,我們的日常生活都是大資料,這樣的大資料使你對科學,認知科學提供了挑戰。
我們去看病,現在不是看醫生,醫生很寶貴,主要是看儀錶。 到了醫院還沒坐三分鐘,醫生一大堆化驗單出來,讓做X光、B超、內鏡檢查、核磁,你還得排隊,排了兩個星期,才把這些檢查做了。 你拿著化驗結果去找醫生,醫生不到三分鐘把藥開出來,現在看病不是看醫生,現在就是查,診查的治療。 醫生跟你說一句話,你還沒聽懂就接待下一個病人,這就是我們日常看病,花錢看儀器,這就是大資料帶來的現實。
這些年來,醫學諾貝爾獎很多頒給了醫學企業的發明,所以現在的高明醫生,要麼是器械的發明,要麼他們能從醫療資料發現價值。 你排隊5分鐘,醫生一看沒問題,他從這個資料裡發現了價值。 大資料時代你會發現,你只要知道了是什麼,就知道怎麼做。
這樣問題就淡化了,為什麼不仔細診斷了,因為這麼多病案,你這個情況在他的病人庫裡非常清楚,所以怎麼做很簡單。
我們認為科學是解決的形而上,技術解決的是形而下,我們研究的物件是認知、智慧。 現在把我們的物件是什麼的問題,可以用大資料來解決,在這樣的情況下,對大資料對不同案例物件的處理,也可以用大資料來解決。 因此這個社會更多研究的是關聯,把科學放在後面。 科學解決因果問題,要解決主次問題,解決前後問題。 所以人們能更多的解決問題就是好漢。
我們對曾經認為的科學是技術的先導產生了懷疑。 在當今情況下,因為IT技術的發展,技術也可以成為科學的先導,要求認知自學的數位化,這是我們大資料對認知科學的認識,以及認知計算的不同。 認知計算是技術。
這樣的情況下,大資料時代對計算正在告別認知科學。
對人的認知而言,歐盟在上世紀就進行了腦科學的研究。 今年澳門又提出了人類大腦計畫的,奧巴馬也發動了腦計畫。 這和我們資訊工作者關聯得太少,全是生命科學家,我覺得我們人類的大腦,從生命科學的角度來講,大家和猴子的大腦區別不是太大,因為已經有研究表明,腦結構差不多。
我就在想,我是在英國學習的,柴契爾後來得了老年癡呆症,我個人認為她的老年癡呆和一般人的老年癡呆沒有多大的區別。 因為我認為腦計畫的研究有一點偏了。
人類和其他動物相比,都有靈感,有語言,唯獨人有文字,因為有文字,才有文明,才有傳承。 我們的青年人到大學,都要學習知識,學習文明,這個很重要。 如果沒有文字,我們和其他動物差不多。
另外還要研究人類認知的社會屬性,這兩個不清楚,認知科學搞不清楚,我建議要把這兩點作為人類認知的切入點。
要研究腦認知的後天屬性,認知不僅是前面的天性所決定的,DNA、基因、遺傳,還要看後天學習和積累的結果,是與社會環境、社會實踐,群體交互相關聯的。
在移動生活時代,我們怎麼辦呢?
大資料時代自然語言處理技術正在改變我們的移動生活。
語言是思想的直接現實,這句話是馬克思講的,語言是人類思維的載體,語言是認知科學和認知計算要應對的首要問題。 我們的移動生活首先要講語言,你哪一天不說話不行,能聽會說是我們必須具備的能力。 讓我們迎接語音時代的到來。 人類走向文明的四個重大里程碑中,語言和文字占了重要的地位。
人類運用自然語言進行交流獲得的效果。 你跟人家溝通得到的效果當中,很重要的就是你的強度和語調,要占38%,還有你的面部表情,它有情感在裡面。 從我們認知科學來說,半個世紀的自然語言理解的研究中,我們對此關注了多少?
人們在思考和解決任何問題時,通常是定性的,對量的規定性往往是是非數值。 我們研究大資料,它有一個定性,定量轉換的問題。 科學研究當中,人們用物件語言表達一個特定的精確學科,比如物理數學、C語言,都是用自然語言來表達。
我們就變成兩個學派的爭論,腦科學認為自然語言是不可計算的。
如果一個問題不能全部形式化,那麼其中的局部問題可不可以形式化? 自然語言可以在什麼程度上被形式化,取決於能否把不確定性形式化。 研究不確定性,我認為是一條道路。
科大訊飛做了一個客服中心,移動客服錄音大資料,可實現一秒鐘對100萬小時音訊資料的檢查。 這就是一個很大的變化。 你是雇傭500位客服人員還是啟用一台 伺服器 ? 所以還是用一台伺服器。 在半個世紀的自然語言理解的研究中,我們對此關注了多少?
我們看報紙,有這麼一段文章,但是你仔細看的時候,發現這個字序不對,但是它又能影響我們多少東西? 在半個世紀的自然語言理解的研究中,我們對此關注了多少?
再看一個例子,我們網上動不動要區分對方是人,我們經常出來一個識別碼,叫你再輸入一遍識別碼,證明你是人。 在半個世紀的語言文本理解的研究中,我們對此又研究了多少?
我覺得要創新,要新思維才能解決。 機器人能聽會說,能看會想,正在改變我們的生活,這就是移動生活的產品。
有一個產品你們可以做做,叫線上服務機器人。 將來IT行業裡面,隨著智慧技術的發展,移動客服中心可以裁減到50人。 我們能不能有個智慧 耳機 ,這是我個人想的,你戴著耳機,我說話,我的口音比較重,你的耳機聽到的是普通話,你能不能做這個? 這個很好,特別是廣東話北方人聽不懂,尤其是語言翻譯。 假如兩國元首會談,奧巴馬的話是普通話,但是是奧巴馬的語音。 這是一個多大的改變。 實際上現在已經有了,這時候就需要雲計算,需要一個方案服務中心,需要一個中文翻譯服務中心,位置服務中心等等。
語音到文字,文字到文字,我們要讓資料說話,這就是大資料給我們移動生活帶來的變化。 所以有人說先幹掉短信。
我這個年齡對五筆字型輸入是情有獨鍾,我們有兩代人都是用五筆字型輸入。 從搜尋引擎到個人化搜索,從規則學習到統計學習,從智慧計算到情感計算,從形式語言學到智慧翻譯。
我們想像將來電視臺主持人他拿到就能念,這個虛擬主持人在形象、情感、動作、語音、語調、風格都像某一個人多好,那我們演員也可以失業了。 這樣的時代也許會到來。
以大資料形態反映的語言,是可交互和理解的、是帶毛的、鮮活的、有情感的原生態語言。
智慧駕駛
下面講講和我們移動生活相關的智慧駕駛,智慧駕駛為什麼火起來呢? 因為它跟雲計算,移動互聯網,大資料密切相關,你只要做了這個東西,政府肯定會支援你。 因為是戰略性新興產業。 當初自然科學基金會在確定這個專案的時候,提出了科學的任務,解決實際的計算問題。 後來把這個科學問題明確地用一個載體來表現,叫做科學任務,在正常的情況下北京開到天津,你能不能做得到?
我們用了很多雷達,我們要有駕駛行為數,在這個過程當中我們遇到了很多的困難,好比說要不要研製一個三維成像,怎麼樣有自學習功能。 我們取得了可喜的成果。
我們有詳細的實驗報告、實驗環境,以及超車的次數,我們今年還和韓國車做了比賽,我們在車子裡做了一個交互鑒定。
我們想想以後怎麼打的? 手機目前來講是人用的,所以以後是人和機器交互,將來你用手機打的,你把手機往 汽車 來一插,汽車就開跑了,到了一個地方,錢一付你就可以走了,你改變路徑,你就用手機跟機器人對話,我們在座的企業家能不能做成,人、 手機和輪式機器人之間的關係。 如果這個做得了就不得了。
我現在的想法是想做這兩個事情,北京從天安門到首都機場做一個實驗,混在正常路徑當中,目前我們有5輛車。 上海我們希望從虹橋機場到浦東再到人民商場,我們準備了6輛車。 一種是電動車,一種是混合動力車,一種是國產車。 一個類型兩輛。 如果有一天北京城出現了飆車機器人,當然這是違法的,你還要問認知可以計算嗎?
大資料時代,技術的有效性要比科學的完整性更重要。 所以我建議這張圖(見下面的PPT),給一些中小企業一些參考,我認為以人為本的認知物聯網的時代已經到來了。 有一個 智慧眼鏡 解決照相問題,解決看的問題,有一個智慧耳機解決聽的問題,有一個智慧筆解決寫的問題,還有智慧手錶,解決你身體測試,以及通訊的需求等等。 這樣一來,以人為本,構成穿戴式設備,這樣就可以幹成很多事情了。 這樣真正可以提高我們移動生活的品質,實現智慧生活。
總結一下,如果說人類對認知問題不能全部完整統一的形式化,這是認知科學要做的事。 我們認知計算可以讓成千上萬的小眾,甚至千千萬萬的特定情況下的認知可以局部的形式化。 那麼,大資料時代的認知計算是否正在逼近認知科學呢?