標籤:enter font 主動學習 版本 解決 form layer data net
論文: Deformable Convolutional Networks
CNN因為其內部的固定的網路結構,對模型幾何變換的識別非常有限。
本paper給出了兩個模組deformable convolution 和 deformable ROI-Pooling來提高CNN的模型變換能力。
過去的辦法解決幾何變換的方法,一,使用data Augmentation來增大不同幾何形狀的object,二,使用sift 或者 sliding windows這樣的方法來解決。
本paper主要針對三個module進行了deformable的改進,deformable Convolution, deformable ROI-Pooling 和 deformable PSROI-Pooling
這裡主要講 conv layer 的 deformable Conv 版本。
本paper是使用公式
針對p0點的像素點,使用Pn是之前conv的方法,添加了^P 來作為offset,其中^P是一個非常小的量。 而這個offset是由
得到的,G(. , .) 是 bilinear interpolation kernel。
在訓練中,同時對conv kernel和offsets進行學習。
其中,該deformable conv kernel的求導為:
這paper的目的是augmentating空間樣本點和RoI-pooling得到額外的offset量,同時在learning 中學習到offset量。
本人觀點:
利用deformable offset 來學習每一個 pixel 的位移量,從而主動學習到object的region。改變了過去方方正正的 object region,可以learn到deformable的region。
論文: Deformable Convolutional Networks