Deep TEN: Texture Encoding Network

來源:互聯網
上載者:User

標籤:desc   輸入   分類   bow   present   pat   instead   des   layer   

紋理特徵,材料分類(Material Classification),在MINC-2500、Flickr Material Database、KTH-TIPS-2b、4D-Light-Field-Material、GTOS上state-of-the-art(2017年)。

思想主要來源是:傳統圖片分類方法都是提取人工設計的特徵(SIFT等)然後使用BOW進行編碼,再用SVM進行分類,後面BOW被VLAD、Fisher Vector編碼替換並融合CNN特徵可以達到sota的效果。然而這樣的方法有缺點,就是編碼和特徵的學習並不是end-to-end的,所以作者設計了一個learnable residual encoding layer。作者還提到一般的CNN的方法雖然在圖片分類和物體識別上有比較好的效果,但是在紋理識別上表現並不理想,給出的理由是:

``` recognizing textures needs for a spatially invariant representation describing the feature distributions instead of concatenation ```

這篇論文的主要貢獻:

1. learnable residual encoding layer。能夠產生魯棒的殘差編碼例如(VLAD和Fisher Vector),能接收任意的輸入解析度,並且產生固定長度的特徵表示,這種編碼方式非常適合pretrained feature的遷移。

2.將feature extraction, dictionary learning, encoding 融合成一個end-to-end的形式。

 

Deep TEN: Texture Encoding Network

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.