頂尖人工智慧無法識別這些簡單圖像

來源:互聯網
上載者:User
關鍵字 人工智慧 這些
摘要: 注:隨著越來越多的東西依賴于越來越難以捉摸的人工智慧(AI),發現後者的缺陷就顯得越來越重要,此文中的黑箱研究就越來越必不可少。 上面的圖案是什麼? 很簡單的黃黑間條嘛

注:隨著越來越多的東西依賴于越來越難以捉摸的人工智慧(AI),發現後者的缺陷就顯得越來越重要,此文中的黑箱研究就越來越必不可少。

上面的圖案是什麼? 很簡單的黃黑間條嘛。 不過如果你問問最先進的人工智慧,它給出的答案會是校車,而且99%地肯定。 但AI錯了。

誠然,現在的電腦圖像識別技術已經非常先進。 比方說,下面這幅圖AI雖不能識別出這是一條戴著墨西哥帽的吉娃娃狗(說實話有的人也未必能認出),但是起碼能識別出這是一條戴著寬邊帽的狗。 但是懷俄明大學進化人工智慧實驗室最近的一項研究卻表明,這些AI未必總是那麼靈光,就像開篇的例子那樣,最先進的AI把這些隨機生成的簡單圖像當成了鸚鵡、乒乓球拍、百吉餅或者蝴蝶。

這一發現迫使我們承認一個明顯但重要的事實:即電腦視覺和人類視覺並不一樣。 而且鑒於我們日益依賴神經網路去訓練電腦識別圖像的,究竟電腦是怎麼想的連我們人類都不知道了。

用進化演算法欺騙AI

進化演算法生成的隨機圖像,圖像下方的文字是AI識別出來的物件。

要想弄清楚這些自我訓練的演算法的聰明之處,方法之一正是看看它們的愚蠢之處。 研究人員決定看看最先進的圖像識別神經網路是不是容易受到主動錯誤資訊的影響。 比方說這些神經網路能認出貓來,那是不是也會把別的東西認成貓呢?

為此,研究人員利用進化演算法生成隨機圖像作為視覺誘餌。 他們首先利用程式生成一幅圖像,然後對圖像進行略微的改變。 接著把原圖和略微修改後的圖一併提交給基於ImageNet訓練的神經網路。 如果修改過的圖被AI認為比原圖更接近某個物件,研究人員就保留修改過的圖,然後重複此過程。 否則的話就回退重試。 這樣下來的結果就是最好看者生存—或者說,是電腦最能識別的的圖像存活了下來(而非最合適者—原圖)。

最後該技術生成了數十幅神經網路的確信度超過99%的圖像。 它們有的是藍橙相間的波浪線,有的是黃黑間條紋等等,可在AI眼裡,它們卻是海星(star fish)和校車(school bus)。

黑箱配對

AI為什麼會上當呢? 有些情況是可以理解的。 比方說,眯著眼睛看的話,校車(school bus)的確看起來像是黃黑間條紋。 類似地,隨機生成的「君王蝴蝶」的確看起來像是蝴蝶翅膀,而被認作「滑雪面罩(ski mask)」的圖像的確看起來像一幅誇張的人臉。

但是,研究人員還發現AI通常還會被純靜態的圖像愚弄。 採用一種略微不同的進化技術之後,研究人員生成了另一組圖像(下圖)。 這些圖像在人眼看來幾乎都是一樣的,就像是一台壞掉的電視上的圖像。 但是在最先進的神經網路眼裡,這些卻是蜈蚣(centipede)、獵豹(cheetah)、孔雀(peacock)等等。

在研究人員看來,神經網路似乎形成了各種有助於識別物件的視覺線索。 這些線索有些是人類熟悉的(如校車的例子),有些則不然。 上圖中例子說明至少在某些時候這些線索是顆細微性很細的。 也許經過訓練後,神經網路把一連串的「綠色綠色、紫色、綠色」圖元視為孔雀看見的模式了。 所以當隨機生成的圖像正好也產生了同樣的圖元系列後,AI就把它當作是孔雀了。 這說明AI也許針對每一種物件都推理出了若干的線索,並認為通過這些線索足以識別出某一物件。

當然,人類精心製作這些圖像來愚弄AI也說明了一個問題,即神經網路的規模和複雜性已經超出人類的理解範疇—哪怕我們知道AI能識別圖像,但對它們如何識別圖像卻並不知曉。

類似的研究其目的正是想通過逆向工程的方法推匯出AI的模型,找出人工智慧的學習思路。 雖然仍不甚了了,但最近兩年的黑箱研究已能管中窺豹。

AI的眼光有問題有問題嗎?

當研究人員把研究結果提交給神經資訊處理系統大會進行討論時,專家形成了涇渭分明的兩派意見。 一組人年紀略大,領域經驗更豐富,他們認為這個結果是完全可以理解的。 另一派人則相對年輕,他們對研究結果的態度是困惑。 至少在一開始對強大的演算法卻把結果完全弄錯感到驚訝。 請記住,儘管這些人稍微年輕一點,但個個都是在頂級AI大會上發表過文章的人了。

而在研究團隊負責人Clune看來,這反映了該領域的世代轉移。 若干年以前,做AI的那幫人還是開發AI的。 而現在,神經網路已經足夠先進,以至於研究人員拿來用就行了。

拿來就能用未必是壞事。 但是隨著越來越多的東西是基於AI來搭建的,那麼發現AI的缺陷就顯得愈發的至關重要。 把一些隨機圖元誤認為是某種動物當然無傷大雅,但是如果AI讓某些色情圖片在安全搜索過濾中漏網性質就很嚴重了。 Clune希望這項研究可以激發其他研究人員跟進,在演算法中考慮到圖像的整體結構。 換句話說,讓電腦視覺更像人類視覺。

同時,這項研究也促使我們考慮AI其他形式的漏洞。 比方說臉部識別也依賴于同類的技術,因此也會有類似缺陷。

如果電腦視覺只是關注于局部特徵的話,也許安上一個3D列印的鼻子就能讓電腦認為你是別人。 戴上一個面具就能讓你從監視系統中消失。 電腦視覺的應用越廣泛,此類隱患就會越大。

不過從更寬泛的意義來說,這項研究帶給我們的警示是我們正進入自我學習系統的時代。 現在,我們仍然控制著自己開發出來的東西。 但隨著AI不斷自我開發自己,有一天我們發現自己搞不懂AI也不奇怪。 「電腦做什麼不再是人寫代碼寫出來的了,」Clune說:「這幾乎是相互作用的元件間的規模效益導致的智慧出現。 」在這一智慧的利用上我們無疑沒有浪費時間。 但是在我們這麼做的時候是否完全理解了它就不太清楚了。




相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.