特徵描述子之HOG運算元_影像處理

來源:互聯網
上載者:User
HOG是一個比較理想的描述邊緣、圖形資訊的運算元了,它能夠有部分抗光照變化能力,但是不具備旋轉不變性和尺度不變性。
HOG運算元在檢測邊緣分明的目標時有較好的效果,比如與SVM結合起來做行人檢測...網上對於HOG運算元原理分析的文章比比皆是,本人也是現學現賣,班門弄斧了。

HOG描述子的提取步驟:

①拉低映像亮度
拉低映像亮度的作用不僅僅是為了減少陰影和光照的影響,也淡化了次級的邊緣,便於目標外形輪廓的提取。
拉低映像亮度採用伽馬壓縮方法,即對每個色彩通道分別做開平方運算或者求Log。

②求取各像素點梯度向量

提取梯度向量的工作大家應該都信手拈來了吧,用梯度運算元([-1,0,1])分別做水平和垂直方向的卷積,在數學意義上也就是分別求取映像x,y方向的偏導,將偏導的平方和開平方即可得到改點的梯度幅值,兩個偏導比值的arctan即為該梯度的方向。HOG運算元會分別計算三個通道的梯度,選取其中幅值最大的作為該點的梯度向量。

梯度幅值及方向計算公式:


③統計cell
將映像分割為N*N大小的像素單元(cell),並將梯度方向均分為9個區間(bin)(360/9=40),之後對cell中的梯度向量在各bin的區間內做長條圖統計,即可得到該cell的梯度方向分布,它是一個9維的特徵向量,接著將相鄰的2*2個cell組成一個block,將它們的特徵向量串聯起來得到一個36維的特徵向量,該向量即為HOG特徵向量。block在全圖的掃描步長為1個cell,也cell是block間共用的,一個cell並不唯一屬於一個block。

所以,HOG特徵向量便是一個block所描述的梯度特徵向量。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.