人工智慧需要有大資料支撐
人工智慧主要有三個分支:
1.基於規則的人工智慧;
2.無規則,電腦讀取大量資料,根據資料的統計、概率分析等方法,進行智慧處理的人工智慧;
3.基於神經元網路的一種深度學習。
基於規則的人工智慧,在電腦內根據規定的語法結構錄入規則,用這些規則進行智慧處理,缺乏靈活性,不適合實用化。 因此,人工智慧實際上的主流分支是後兩者。
而後兩者都是通過「電腦讀取大量資料,提升人工智慧本身的能力/精准度」。 如今,大量資料產生之後,有低成本的儲存體將其存儲,有高速的CPU對其進行處理,所以才有了人工智慧後兩個分支的理論得以實踐。 由此,人工智慧就能做出接近人類的處理或者判斷,提升精准度。 同時,採用人工智慧的服務作為高附加值服務,成為了獲取更多使用者的主要因素,而不斷增加的使用者,產生更多的資料,使得人工智慧進一步優化。
大資料採礦少不了人工智慧技術
大資料分為「結構化資料」與「非結構化資料」。
「結構化資料」是指企業的客戶資訊、經營資料、銷售資料、庫存資料等,存儲于普通的資料庫之中,專指可作為資料庫進行管理的資料。 相反,「非結構化資料」是指不存儲于資料庫之中的,包括電子郵件、文字檔、圖像、視頻等資料。
目前,非結構化資料激增,企業資料的80%左右都是非結構化資料。 隨著社交媒體的興起,非結構化資料更是迎來了爆發式增長。 複雜、海量的資料通常被稱為大資料。
但是,這些大資料的分析並不簡單。 文本挖掘需要「自然語言處理」技術,圖像與視頻解析需要「圖像解析技術」。 如今,「語音辨識技術」也不可或缺。 這些都是傳統意義上人工智慧領域所研究的技術。
搜尋引擎中的大資料與人工智慧
將大資料與人工智慧結合運用最好的當屬Google和Apple。
Google提供優化的搜尋引擎服務,後臺的人工智慧隨著使用者的使用而不斷進化,使用的使用者越多,搜尋引擎也將越優化,優化之後,使用者自然也就更多。 除了搜尋引擎,Google還通過Gmail、Google Docs等獲取大量的「非結構化資料」。 這樣一來,Google的「大腦」就變得更加聰明瞭。
此外,Google還研發了「語義搜索」的進化系統;Apple的語音辨識技術Siri也是基於最新人工智慧理論(深度學習)構建的。
反過來看,現代的人工智慧進化,不僅需要理論研究,還需要大量的資料作為原料。
汽車中的大資料與人工智慧
2014年年初,Google聯合奧迪、通用、本田、現代以及Nvidia成立了一個新的合作團體:開放汽車聯盟(Open Automotive Alliance);而Apple在去年6月就涉足汽車領域,推出了「iOS in the Car」(通過Siri語音操作可以實現導航、通話、音樂播放等服務)。
最近,Google又宣佈將于2017年向市場投入自動駕駛汽車,2013年8月已經完成了48萬公里的試駕。 48萬公里試駕的大資料成為了行駛經驗資料,為人工智慧的自動駕駛提供了決策分析依據。
顛覆式創新源自大資料+人工智慧
Google和Apple已經給汽車等傳統行業帶來了深深的危機感。 而他們的顛覆式創新,其實是來自大資料與人工智慧的結合。 或許這一點非常值得我們思考。 同樣的現象、同樣的顛覆會不會發生在更多的,甚至是所有的其他傳統產業中呢?
作者:工業和資訊化部國際經濟技術合作中心 王喜文
(責任編輯:mengyishan)