從別的地方找到的有關sobel的講解,感覺講的很好。貼來供大家參考以及留做以後用~
首先,我們來開一下電腦是如何檢測邊緣的。
以灰階映像為例,它的理論基礎是這樣的,如果出現一個邊緣,那麼映像的灰階就會有一定的變化,為了方便假設由 黑漸層為白代表一個邊界,那麼對其灰階分析,在邊緣灰階函數就是一個一次函數y=kx,對其求一階導數就是其斜率k,就是說邊緣的一階導數是一個常數,而由於非邊緣的一階導數為零,這樣通過求一階導數就能初步判斷映像的邊緣了。通常是X方向和Y方向的導數,也就是梯度。理論上電腦就是通過這種方式來獲得映像的邊緣。
但是,具體應用到映像中你會發現這個導數是求不了的,因為沒一個準確的函數讓你去求導,而且電腦在求解析解要比求數值解麻煩得多,所以就想到了一種替代的方式來求導數。就是用一個3×3的視窗來對映像進行近似求導。拿對X方向求導為例,某一點的導數為第三行的元素之和減去第一行元素之和,這樣就求得了某一點的近似導數。其實也很好理解為什麼它就近似代表導數,導數就代表一個變動率,從第一行變為第三行,灰階值相減,當然就是一個變動率了。這就是所謂的 Prewitt運算元。這樣近似X方嚮導數就求出來了。Y方嚮導數與X方嚮導數求法相似,只不過是用第三列元素之和減去第一列元素之和。X方向Y方嚮導數
有了,那麼梯度也就出來了。這樣就可以找出一幅圖中的了。
還有一個問題,由於求的是3×3中心點的導數,所以給第二列加了一個權重,它的權重為2,第一列和第三列的權重為1,好了,這就是Sobel運算元了。相比Prewitt運算元,Sobel
的抗噪能力更強。:這樣,中心點的X方嚮導數就求出來了。
舉個例子吧。X點以Sobel方式求導數ΔX=1×50+2×30+1×50-1×50+2×30+1×50)=0。這樣可以看出這個點不是邊界。
好了,瞭解了基本理論之後,我們看看OpenCv下的Sobel函數吧,void cvSobel( const CvArr* src, CvArr* dst, int xorder, int yorder, int aperture_size=3 );src:輸入映像;dst輸出映像;xorder:x 方向上的差分階數;yorder:y 方向上的差分階數;aperture_size 擴充 Sobel 核的大小(既視窗階數),必須是 1(注意這是一個3×1或1×3向量而不是一個方陣),
3, 5 或 7。
下面編寫一個Sobel邊緣檢測的程式吧,平台是VS08,建立Win32控制台應用程式。
#include <cv.h> #include <highgui.h> void main() { IplImage *frame,*gray,*sobel; frame=cvLoadImage("lena.jpg");//載入映像 gray=cvCreateImage(cvGetSize(frame),frame->depth,1);//分配映像空間 sobel=cvCreateImage(cvGetSize(frame),frame->depth,1); cvNamedWindow("frame"); cvNamedWindow("gray"); cvNamedWindow("sobel"); cvCvtColor(frame,gray,CV_BGR2GRAY);//轉為灰階 cvSobel(gray,sobel,1,0,3); cvShowImage("frame",frame);//顯示映像 cvShowImage("gray",gray); cvShowImage("sobel",sobel); cvWaitKey(0);//等待cvReleaseImage(&frame);//釋放空間(對視頻處理很重要,不釋放會造成記憶體泄露) cvReleaseImage(&gray); cvReleaseImage(&sobel); cvDestroyWindow("frame"); cvDestroyWindow("gray"); cvDestroyWindow("sobel"); }
運行,你會發現出錯,仔細看看沒有問題啊。其實,這裡是問題的,因為以Sobel方式求完導數後會有負值,還有會大於255的值而你建的Sobel的映像是IPL_DEPTH_8U,也就是8位無符號數,所以Sobel建立的映像位元不夠,要16位有符號的,也就是 IPL_DEPTH_16S。把建立映像這句改為 sobel=cvCreateImage(cvGetSize(frame),IPL_DEPTH_16S,1);運行,發現不報錯了,但是Sobel映像顯示不出來,這是什麼原因呢?原來映像顯示是以8位無符號顯示的,現在是16位有符號,當然顯示會出問題了。所以還要將Sobel轉為8位無符號。
OpenCv裡提供了一個函數,就是cvConvertScaleAbs( const CvArr* src, CvArr* dst, double scale=1, double shift=0 );src:源映像;dst:靶心圖表像;scale:轉化前乘的係數;shift轉化前加的係數。這樣建立一個無符號地圖像再轉換就可以實現了。IplImage *sobel8u=cvCreateImage(cvGetSize(sobel),IPL_DEPTH_8U,1);
再在顯示映像前加上cvConvertScaleAbs(sobel,sobel8u,1,0);這樣就可以看到cvSobel的效果了。可以看X方向或Y方向求導是什麼效果。 為了方便大家,我把改好後的程式也放上來了。
#include <cv.h>
#include <highgui.h>
void main()
{
IplImage *frame,*gray,*sobel;
frame=cvLoadImage("e:/p1.jpg");//
載入映像
gray=cvCreateImage(cvGetSize(frame),frame->depth,1);//
分配映像空間
sobel=cvCreateImage(cvGetSize(frame),IPL_DEPTH_16S,1);
cvNamedWindow("frame");
cvNamedWindow("gray");
cvNamedWindow("sobel");
cvCvtColor(frame,gray,CV_BGR2GRAY);//
轉為灰階
cvSobel(gray,sobel,1,0,3);
IplImage *sobel8u=cvCreateImage(cvGetSize(sobel),IPL_DEPTH_8U,1);
cvConvertScaleAbs(sobel,sobel8u,1,0);
cvShowImage("frame",frame);//
顯示映像
cvShowImage("gray",gray);
cvShowImage("sobel",sobel8u);
cvWaitKey(0);//
等待
cvReleaseImage(&frame);//
釋放空間(對視頻處理很重要,不釋放會造成記憶體
泄露)
cvReleaseImage(&gray);
cvReleaseImage(&sobel);
cvDestroyWindow("frame");
cvDestroyWindow("gray");
cvDestroyWindow("sobel");