SPPNet論文翻譯-空間金字塔池化Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

來源:互聯網
上載者:User

標籤:cnn   border   pointer   表示   地址   point   center   zha   效能   

http://www.dengfanxin.cn/?p=403

原文地址

我對物體檢測的一篇重要著作SPPNet的論文的主要部分進行了翻譯工作。SPPNet的初衷非常明晰,就是希望網路對輸入的尺寸更加靈活,分析到卷積網路對尺寸並沒有要求,固定尺寸的要求完全來源於全串連層部分,因而藉助空間金字塔池化的方法來銜接兩者,SPPNet在檢測領域的重要貢獻是避免了R-CNN的變形、重複計算等問題,在效果不衰減的情況下,大幅提高了識別速度。
 
用於視覺識別的深度卷積網路空間金字塔池化方法Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun 摘要當前深度卷積神經網路(CNNs)都需要輸入的映像尺寸固定(比如224×224)。這種人為的需要導致面對任意尺寸和比例的映像或子映像時降低識別的精度。本文中,我們給網路配上一個叫做“空間金字塔池化”(spatial pyramid pooling,)的池化策略以消除上述限制。這個我們稱之為SPP-net的網路結構能夠產生固定大小的表示(representation)而不關心輸入映像的尺寸或比例。金字塔池化對物體的形變十分魯棒。由於諸多優點,SPP-net可以普遍協助改進各類基於CNN的映像分類方法。在ImageNet2012資料集上,SPP-net將各種CNN架構的精度都大幅提升,儘管這些架構有著各自不同的設計。在PASCAL VOC 2007和Caltech101資料集上,SPP-net使用單一全映像表示在沒有調優的情況下都達到了最好成績。SPP-net在物體檢測上也表現突出。使用SPP-net,只需要從整張圖片計算一次特徵圖(feature map),然後對任意尺寸的地區(子映像)進行特徵池化以產生一個固定尺寸的表示用於訓練檢測器。這個方法避免了反覆計算卷積特徵。在處理測試映像時,我們的方法在VOC2007資料集上,達到相同或更好的效能情況下,比R-CNN方法快24-102倍。在ImageNet大規模視覺識別任務挑戰(ILSVRC)2014上,我們的方法在物體檢測上排名第2,在物體分類上排名第3,參賽的總共有38個組。本文也介紹了為了這個比賽所作的一些改進。 繼續閱讀(最佳閱讀體驗)

SPPNet論文翻譯-空間金字塔池化Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.