Siamese Network 孿生網路

來源:互聯網
上載者:User

標籤:ast   term   The   使用   sdn   傳統   log   iss   思想   

 

介紹:

Siamese網路是一種相似性度量方法,當類別數多,但每個類別的樣本數量少的情況下可用於類別的識別、分類等。傳統的用於區分的分類方法是需要確切的知道每個樣本屬於哪個類,需要針對每個樣本有確切的標籤。而且相對來說標籤的數量是不會太多的。當類別數量過多,每個類別的樣本數量又相對較少的情況下,這些方法就不那麼適用了。其實也很好理解,對於整個資料集來說,我們的資料量是有的,但是對於每個類別來說,可以只有幾個樣本,那麼用分類演算法去做的話,由於每個類別的樣本太少,我們根本訓練不出什麼好的結果,所以只能去找個新的方法來對這種資料集進行訓練,從而提出了siamese網路。siamese網路從資料中去學習一個相似性度量,用這個學習出來的度量去比較和匹配新的未知類別的樣本。這個方法能被應用於那些類別數多或者整個訓練樣本無法用於之前方法訓練的分類問題。

 

原理:

主要思想是通過一個函數將輸入映射到目標空間,在目標空間使用簡單的距離(歐式距離等)進行對比相似性。在訓練階段去最小化來自相同類別的一對樣本的損失函數值,最大化來自不同類別的一堆樣本的損失函數值

給定一組映射函數,其中參數為W,我們的目的就是去找一組參數W。使得當和屬於同一個類別的時候,相似性度量是一個較小的值,當和屬於不同的類別的時候,相似性度量較大。這個系統是用訓練集中的成對樣本進行訓練。當和來自相同類別的時候,最小化損失函數,當和來自不同類別的時候,最大化

 

最終思想:

其實講了這麼多,主要思想就是三點: 
1、輸入不再是單個樣本,而是一對樣本,不再給單個的樣本確切的標籤,而且給定一對樣本是否來自同一個類的標籤,是就是0,不是就是1 
2、設計了兩個一模一樣的網路,網際網路共用權值W,對輸出進行了距離度量,可以說l1、l2等。 
3、針對輸入的樣本對是否來自同一個類別設計了損失函數,損失函數形式有點類似交叉熵損失: 

 最後使用獲得的損失函數,使用梯度反傳去更新兩個網際網路共用的權值W。

 

 

在我個人理解,Siamese就是一個相似性比較(模板匹配也可以,就是這類東西)演算法,比較目標幀中和模板圖片的相似程度,給出相似性最大的位置,就是目標幀中目標所在的位置。

用作者的話說就是離線訓練一個通用的相似學習問題,能夠用在線上跟蹤上面。

Siamese Network 孿生網路

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.