摘要: 當BAT( 百度 、阿裡巴巴( 滾動資訊 )、 騰訊 )中的騰訊、阿裡正在圍繞移動入口廣撒投資網買未來時,看似掉隊的百度,卻在從技術裡謀未來。 百度內部有個百度大腦的專案,用技術模
當BAT( 百度 、阿裡巴巴( 滾動資訊 )、 騰訊 )中的騰訊、阿裡正在圍繞移動入口廣撒投資網「買未來」時,看似「掉隊」的百度,卻在從技術裡「謀未來」。
「百度內部有個‘百度大腦’的專案,用技術類比人腦思維,現在大約已經相當於2~3歲孩子的智力水準。 隨著計算成本的飛速下降和計算能力的飛速提升,未來十幾二十年,這樣的大腦或許比人腦還要聰明。 」昨日,百度董事長兼CEO李彥宏表示。
「人們會習慣忽視量變,但質變的時候會被打得措手不及。 」李彥宏說。 他的一番表態從某種程度上,更像是對近來外界批評百度在巨頭之爭中「掉隊」的回應。
像人類大腦一樣思考
「現在已經可以看到一些端倪,如無人駕駛汽車、智慧型機器人,可以看到有機器人代替酒店的行李員幫你拿行李,很多事情現在就已經可以做。 等過5年、10年,我們可以看到,更多的東西可以通過互聯網的方式來完成,那時中國的社會也會發生更加根本的改變。 」對於互聯網的未來,李彥宏這樣預測。
百度方面資料顯示,百度大腦是百度人工智慧的產品,融合了深度學習演算法、資料建模、大規模GPU並行化平臺等技術,實現了即時學習和成長,它擁有200億個參數,構成了一套巨大的深度神經網路。
事實上,百度對深度學習的佈局一年有餘。 2013年年初,百度成立深度學習研究院IDL(Institute of Deep Learning),李彥宏親自任院長一職,出馬延攬矽谷技術專家,如 Facebook 前資深科學家徐偉,美國新澤西州立大學統計學教授張潼, 異構計算專家、 AMD 異構系統前首席軟體架構師吳韌,「千人計畫」國家特聘專家余凱等專家。
有趣的是,百度在美國矽谷設立的IDL,位於加利福尼亞州庫比蒂諾附近,距離山景市的 谷歌 總部僅6英里,在當地被稱為「谷歌後花園」。
到了2014年年初,百度通過「少帥計畫」攬人才,面向全球招募9名30歲以下的人工智慧領域青年精英,提供的是T9、T10職級,這意味著年薪百萬元起步。
昨日,百度對外表示,深度學習在百度自身產品上已經開始應用。 例如百度大腦已經可以理解語音、圖像、文本形式的檢索請求,根據相關性做搜索排序;以及通過CTR(廣告點選率)預估,做廣告的精准匹配。
目前最新的進展是,通過深度學習技術的百度大腦,在語音技術方面,相對錯誤率降低了25%以上,移動搜索中文語音辨識率突破90%;圖像技術方面,推出全網人臉搜尋引擎;而在全流量上線廣告CTR的預估方面也有提升。
大資料改變傳統行業
在全球範圍內,此前有斯坦福大學和 IBM 、Google、 微軟 、Facebook四家科技巨頭設立了同類的深度學習研究機構。
此前,Google科學家傑夫·狄恩(Jeff Dean)告訴《第一財經日報》記者,Google X利用由16000多個處理器、10億個內部節點組成的虛擬大腦,分析了1000萬幀從YouTube上隨機抓取的無標籤視訊短片圖片, 經過了10天時間的運轉,「大腦」終於認識了什麼是貓,並從接下來輸入的2萬張圖片中準確找出了貓的照片。
傑夫·狄恩對本報記者預計,這項機器學習技術未來將用以説明實現高品質的語音辨識、實用型電腦視覺、攔截垃圾郵件,甚至應用於谷歌自動駕駛汽車。
而百度的做法是把開放雲、資料工廠、百度大腦組成「大資料引擎」,把大資料存儲、分析和智慧化處理等一整套核心能力通過平臺化、介面化的方式對外開放。
例如,上傳海量孩子的哭聲,根據小孩的哭聲資料庫來預測可能的症狀;通過使用者的脈搏、血壓、心電等資料積累,依據海量資料判斷或預警使用者可能產生的病情等等。
百度昨日稱,其大資料引擎將經歷逐步開放的過程,目前採取邀請制和免費模式,和政府、非政府組織、製造、醫療、金融、零售和教育等傳統領域展開合作。
這些合作企業和機構將能夠線上使用百度的大資料架構,處理自身積累的大資料,同時融合百度大資料技術進行挖掘處理,改造傳統行業的企業管理、商業模式等環節。
昨日,中國疾病預防控制中心(CDC)副主任高福表示,雙方將結合疾控大資料與百度大資料,建成中國首個流感預測系統。
一位百度內部人士則對記者表示,傳統行業市場空間較大,大量行業的單行業產值都在萬億級以上,百度大資料核心能力開放的「野心」是打開萬億級產業升級的想像空間。
但當阿裡已經逼近千億市值,而騰訊市值也在微信的推進下節節攀升時,百度仍需耐得住寂寞。 目前百度仍有巨大的前期投入,這已經在百度的財報中顯現出來:2013年全年,百度在技術研發方面的投入達41.07億元,比2012年增長78.2%。