電腦如何“看”我們的世界

來源:互聯網
上載者:User

標籤:

電腦如何“看”我們的世界

電腦雖然有了人工智慧的程式支援,但事實上也不能將其機器學習的功能等同於像人類那樣。至少,到目前還不是這樣。那麼,向Google的圖片識別或者Facebook的M應用等一類系統,它們是怎麼能夠理解自然語言或視覺的呢?

下面,是人工智慧系統Josh的自我獨白:

簡而言之,我們將單詞和短語的含義以數位形式儲存在電腦上。目前,市場上有許多這類產品,比如將單詞轉換成向量形式的工具word2vec,該工具使用淺人工神經網路來計算文字嵌入。此外也有一些諸如記憶網路的技術,能夠自主學習文本,進行一些簡單有限的問答。

在過去的幾年中,由於先進的人工神經網路演算法有了許多驚人的成果,Image Recognition和數字訊號處理技術異常火爆。但是相比較之下,同是人工智慧領域的理解自然語言方面似乎顯得困難得多,為什麼呢?

自然語言處理本質上是另一種約束關係的問題

研究自然語言是困難的,很多時候甚至超過了我們的想象——因為語言永遠不變的是改變,因為全世界有千萬種語言……無論你的觀點是什麼,自然語言難以為演算法所處理的最大原因是——我們沒有足夠多的樣本。

確實,我們擁有大量的文本資源,包括書籍、部落格、社交媒體等。但即便如此,我們得到的用以分析的文本相對來說還顯得不足。看一看以片:

當我們分析音頻資料,或者映像資料時,事實上我們得到的資料資訊比人類意識中的要多。以佳能5D Mark III相機為例,攝影領域的人通常會說這是一個令人尊敬的相機,因為它有著5760 x 3840的解析度。因為每個顏色像數都分別由紅、藍、綠、α值(RGBA)來表示,所以每個像素擁有4個標準數值。在其原始格式當中,一張這種像素的圖片大約含有 88.47 MB資料。相比較之下,莎士比亞的所有作品也只有4.4 MB。一個像數等於4個位元組,一個字元則佔一個位元組。

這意味著:

1、解析文本的時候,每一個令牌(字詞的NLP術語)更多的是影響文本的整體分析。

2、產生文本的時候,每一個被選出來的令牌才能影響結果。

換句話說,在文本當中,字元和令牌才是佔據主要成分的元素,和像素不同。

好了,那我們是如何處理文本的呢?

在一個嚴格的解析系統中,我們需要用數值格式來表示文本,提示為向量形式。現在我們還是要繼續理解很簡單的向量表示,而未來則可以處理更為複雜的表達了。

我們來以幾個片語為例:

1. Turn on the lights(開燈)

2. Power on the lights(開啟燈的電源)

3. What time is it?(現在幾點?)

4. What is the current time?(目前時間是幾點?)

我們需要做的是建立一個叫詞典的東西。換句話說,我們想要將現有的片語用特有的令牌技術來建立一個詞彙表。然後,我們需要對資訊做一些隱式預先處理,去掉標點符號等。最後,我們給每一個唯一碼賦予其各自的索引,從而產生自己的詞彙向量:

0 turn

1 on

2 the

3 lights

4 power

5 what

6 time

7 is

8 it

9 current

由於每一個字代表一個索引,因此我們可以使用反向散列資料結構來得到每個單詞的索引,然後無論是否每一個字都是給定文本,我們都可以將這些字表示為一系列的布爾值(布爾值:是“真”True或“假”False中的一個)。比如,上述例句就可以表示為:

1. { 1, 1, 1, 1, 0, 0, 0, 0, 0, 0 }

2. { 0, 1, 1, 1, 1, 0, 0, 0, 0, 0 }

3. { 0, 0, 0, 0, 0, 1, 1, 1, 1, 0 }

4. { 0, 0, 1, 0, 0, 1, 1, 1, 0, 1}

有了這些向量,我們可以使用向量點積得到一個粗略的相似性計算。所謂點積,就是接受在實數R上的兩個向量並返回一個實數值標量的二元運算。

所以,上述前兩個例句的點積就是:

1 * 0 = 0

1 * 1 = 1

1 * 1 = 1

1 * 1 = 1

0 * 0 = 0

0 * 0 = 0

0 * 0 = 0

0 * 0 = 0

0 * 0 = 0

0 * 0 = 0

這些數值加起來和是3。而如果將第一個和第三個句子做同樣的處理:

1 * 0 = 0

1 * 0 = 0

1 * 0 = 0

1 * 0 = 0

0 * 0 = 0

0 * 1 = 0

0 * 1 = 0

0 * 1 = 0

0 * 1 = 0

0 * 0 = 0

那麼和為0。這就是說,“Turn on the lights”和“What time is it”沒有絲毫的相似。

你也許會發現,我們目前的詞彙處理規模小到只有10個詞。不過,未來當我們探索更多語義詞嵌入時,我們還可以壓縮向量,獲得更準確的上下文理解和表達。

日日啪 http://www.riripa.cn

電腦如何“看”我們的世界

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.