python opencv 長條圖反向投影的方法,pythonopencv
本文介紹了python opencv 長條圖反向投影的方法,分享給大家,具體如下:
目標:
長條圖反向投影
原理:
反向投影可以用來做映像分割,尋找感興趣區間。它會輸出與輸入映像大小相同的映像,每一個像素值代表了輸入映像上對應點屬於目標對象的機率,簡言之,輸出映像中像素值越高的點越可能代表想要尋找的目標。長條圖投影經常與camshift(追蹤演算法)演算法一起使用。
演算法實現的方法,首先要為包含我們感興趣地區的映像建立長條圖(範例要找一片草坪,其他的不要)。被尋找的對象最好是佔據整個映像(映像裡全是草坪)。最好使用顏色長條圖,物體的顏色資訊比灰階映像更容易被分割和識別。再將顏色長條圖投影到輸入映像尋找目標,也就是找到輸入映像中每一個像素點的像素值在長條圖中對應的機率,這樣就得到一個機率映像,最後設定適當的閾值對機率映像進行二值化。
numpy演算法:
建立兩幅顏色長條圖,靶心圖表像長條圖(M),輸入映像長條圖(I)
import cv2import numpy as npfrom matplotlib import pyplot as plt#roi圖片,就想要找的的圖片roi = cv2.imread('3.jpg')hsv = cv2.cvtColor(roi,cv2.COLOR_BGR2HSV)#目標搜尋圖片target = cv2.imread('33.jpg')hsvt = cv2.cvtColor(target,cv2.COLOR_BGR2HSV)#建立長條圖M = cv2.calcHist([hsv],[0,1],None,[180,256],[0,180,0,256])I = cv2.calcHist([hsvt],[0,1],None,[180,256],[0,180,0,256])
計算比值:R=MI。反向投影R,根據R這個調色盤建立新映像,每一個像素代表這個點事目標的機率。例如,B(x,y)=R[h(x,y),s(x,y),其中H為點(x,y)的色調(hue)值,s為點(x,y)的飽和度(saturation)。最後加入條件B(x,y)=min([B(x,y),1]
h,s,v = cv2.split(hsvt)B = R[h.ravel(),s.ravel()]B = np.minimum(B,1)B = B.reshape(hsvt.shape[:2])
使用圓盤運算元做卷積,B=D×B,其中D為卷積核
disc = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(5,5))#定義結構形狀,5×5的橢圓B=cv2.filter2D(B,-1,disc)#對映像進行卷積運算B = np.uint8(B)cv2.normalize(B,B,0,255,cv2.NORM_MINMAX)
其中函數cv2.getStructuringElement是定義結構元素,例如element = cv2.getStructuringElement(cv2.MORPH_CROSS,(5,5)) 定義了一個十字形,5×5的結構
輸出映像中灰階最大的地方就是目標位置。如果要找的是一個地區,可以使用一個閾值對映像二值化,這樣能得到不錯的結果。
ret,thresh = cv2.threshold(B,50,255,0)
opencv反向投影
函數 cv2.calcBackProject()直接實現反向投影,參數與cv2.calcHist基本一致。其中一個參數是要尋找的目標的長條圖。在使用目標長條圖反向投贏錢應該進行歸一化處理。返回結果是一個機率映像,然後進行圓盤形狀卷積操作,再二值化。
roi地區圖片
待搜尋圖片
結果
import cv2import numpy as npfrom matplotlib import pyplot as plt#roi圖片,就想要找的的圖片roi = cv2.imread('33.jpg')hsv = cv2.cvtColor(roi,cv2.COLOR_BGR2HSV)#目標搜尋圖片target = cv2.imread('3.jpg')hsvt = cv2.cvtColor(target,cv2.COLOR_BGR2HSV)#計算目標長條圖roihist = cv2.calcHist([hsv],[0,1],None,[180,256],[0,180,0,256])#歸一化,參數為原映像和輸出映像,歸一化後值全部在2到255範圍cv2.normalize(roihist,roihist,0,255,cv2.NORM_MINMAX)dst = cv2.calcBackProject([hsvt],[0,1],roihist,[0,180,0,256],1)#卷積串連分散的點disc = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(5,5))dst = cv2.filter2D(dst,-1,disc)ret,thresh = cv2.threshold(dst,50,255,0)#使用merge變成通道映像thresh = cv2.merge((thresh,thresh,thresh))#蒙板res = cv2.bitwise_and(target,thresh)#矩陣按列合并,就是把target,thresh和res三個圖片橫著拼在一起res = np.hstack((target,thresh,res))cv2.imwrite('res.jpg',res)#顯示映像cv2.imshow('1',res)cv2.waitKey(0)
以上就是本文的全部內容,希望對大家的學習有所協助,也希望大家多多支援幫客之家。