標籤:
在徹底瞭解mean shift之前,我們需要解決三個問題:
第一個問題:無參數密度估計
無參數密度估計,它對資料分布規律沒有附加任何假設,而是直接從資料樣本本身出發研究資料分布特徵,對先驗知識要求少,完全依靠訓練資料進行估計,而且能夠處理任意的機率分布。
eg. 長條圖法,最近鄰域法,核密度估計法。
而有參數密度估計有:高斯統計模型
舉個例子:
有N個資料點,它們的座標分布如所示,如何求出這個地區中,哪個位置的樣本分布密度最大,換言之,如果來了第N+1個樣本點,它最大的可能出現位置在哪裡。
第二個問題:Kernel density estimation
給定維空間中的樣本集合,則點關於核函數和頻寬矩陣的核函數密度估計表示為:
其中
由於,可將密度估計寫成關於核函數的輪廓函數形式:
由上面的公式可以看出,其實核函數密度估計最後可以看做成為一種權值函數,其作用是將每個樣本點按與點x的距離遠近進行加權,距離x點近的樣本點機率密度估計影響大,賦予權值也越大;反之權值越小。
第三個問題:Mean shift 向量
從上輪可以得出對資料的核函數密度估計,現在我們要對這個機率密度分布來分析資料集合中密度最大的資料分布位置,首先對Kernel密度函數求導,
令導數=0,可以得到
則該x的位置就是機率密度最大的點位置。
我們令表示為Mean shift 向量,則有
因此,Mean shift 向量的平均位移量(即梯度方向)會指向樣本點最密的方向。Mean shift會轉移到樣本點相對變化最多的地方。而且離x越近的樣本點對估計x周圍的統計特性越重要,核函數的概念引入,可以理解為其實質就是每個樣本點對x的權值貢獻。可以打個比喻,想象一下幾十匹馬同時拉一輛車的恢弘場面(當然這輛車得夠穩定,不會爛~),每匹馬都往自己的方向拉,不過,距離x越近的馬,其力量越大,最後的結果方向當然是朝著合力的方向移動,即如的黃色箭頭方向。
Application I. Image Segmentation:
本質上,mean shift解決問題都是基於轉化為密度估計問題。對於映像應用,spatial資訊有2維,range空間有p維。
映像分割中使用的多元核:
分別為座標空間核和色彩空間核的頻寬(bandwidth)。Discontinuity Preserving Smoothing濾波後的結果如下:
映像分割就是在濾波後對相同像素值的點進行聚類,分成M個地區。
Application II. Tracking
基於Mean shift的目標跟蹤演算法通過分別計算目的地區域和候選地區內像素的特徵值機率,得到關於目標模型和候選模型的描述,然後利用相似函數度量初始幀目標模型和當前幀候選地區的相似性,選擇相似函數最大的候選模型並得到關於目標模型的Mean shift向量,這個向量正是目的地區域由初始位置向正確位置移動的位移向量。由於Mean shift演算法的快速收斂性,通過不斷迭代計算Mean shift向量,演算法最後將可以收斂到目標的真實位置,從而達到Tracking目的。
Mean shift 跟蹤結果
電腦視覺總結(一)——Mean shift