一、引言:在需要監控的環境裡,如何能夠判斷出進入特定地區的目標,並且能夠跟蹤目標的軌跡。分為兩種情況:一是靜態背景下的目標跟蹤;二是動態背景下的目標跟蹤。
二、靜態背景下的目標跟蹤方法
1、單目標:目標跟蹤還可以分為單目標的跟蹤和多目標的跟蹤。單目標的靜態背景下的目標跟蹤指的是網路攝影機是固定在某一方位,其所觀察的視野也是靜止的。通常採用背景差分法,即先對背景進行建模,然後從視頻流中讀取映像(我們稱之為前景映像),將前景映像與背景映像做差,就可以得到進入視野的目標物體。對於目標的描述,通常用目標連通地區的像素數目的多少來表達目標的大小,或者用目的地區域的高寬比等。目標的位置資訊可採用投影的方式來定位。
2、多目標:靜態環境下的多目標跟蹤,需要確定每個目標的特徵,位置,運動方向,速度等資訊。
3、預先處理:由於獲得的映像總會有著雜訊,需要對映像做一些預先處理,如高斯平滑,均值濾波,或者進行一些灰階展開等映像增強操作。
三、動態背景下的目標跟蹤
網路攝影機在雲台控制下的旋轉,會使得他所採集的映像時可在變化,所以,對於整個目標跟蹤過程來說,背景是變化,目標也是在整個過程中運動的,所以跟蹤起來較有難度。
目前課題組提出的方案是:跟蹤過程:在網路攝影機不同偏角情況下取得若干背景圖片,建立背景圖片庫――>網路攝影機保持固定時,取得當前幀圖片,與圖片庫中的背景映像匹配,背景差分(灰階差分?),獲得目標――>目標特徵提取――>即時獲得當前幀圖片,採用跟蹤演算法動態跟蹤目標。
提取特徵是一個痛點,課題組提出多色彩空間分析的方法。根據彩色映像在不同的色彩空間裡表徵同一物體呈現出的同態性,可以把目標物體在不同的色彩空間裡進行分解,並將這些關鍵特徵資訊進行融合,從而找出判別目標的本質特徵。
跟蹤過程中採用的各種方法說明:
1)在0-360度不同偏角時,獲得背景圖片,可進行混合高斯背景建模,建立圖片庫,以俯仰角和偏轉角不同標誌每張背景圖片,以備匹配使用;
2)背景差分獲得目標後,對差分映像需要進行平滑、去噪等處理,去除幹擾因素;
3)對目標採用多色彩空間(HSV、YUV)特徵提取,對不同色彩空間的特徵相與(AND),得到目標特徵,以更好的在當前幀圖片中找到目標;
4)即時得到的當前幀圖片,進行混合高斯建模,排除樹葉搖動等引起的背景變化;
5)跟蹤演算法可採用多子塊匹配方法、camshift方法等。
四、相關理論介紹
近幾年來,一種名為CamShift的跟蹤演算法憑藉其在即時性和魯棒性方面良好的表現,正受到越來越多的關注。現階段CamShift演算法已經廣泛應用到感知使用者介面中的人臉跟蹤中,以及一些半自動的運動目標跟蹤。一方面,CamShift演算法應該屬於基於地區的方法,它利用地區內的顏色資訊對目標進行跟蹤;另一方面,CamShift演算法卻是一種非參數技巧,它是通過聚類的方式搜尋運動目標的。
簡單的說,CamShift演算法利用目標的顏色特徵在視頻映像中找到運動目標所在的位置和大小,在下一幀視頻映像中,用運動目標當前的位置和大小初始化搜尋視窗,重複這個過程就可以實現對目標的連續跟蹤。在每次搜尋前將搜尋視窗的初始值設定為運動目標當前的位置和大小,由於搜尋視窗就在運動目標可能出現的地區附近進行搜尋,這樣就可以節省大量的搜尋時間,使CamShift演算法具有了良好的即時性。同時,CamShift演算法是通過顏色匹配找到運動目標,在目標運動的過程中,顏色資訊變化不大,所以CamShift演算法具有良好的魯棒性。由於RGB色彩空間對光照亮度變化比較敏感,為了減少光照亮度變化對跟蹤效果的影響,CamShift 演算法將映像由RGB 色彩空間轉化到HSV 色彩空間進行後續處理。
CamShift 的演算法流程3.4 所示。首先選擇初始搜尋視窗,使視窗恰好包含整個跟蹤目標,然後對視窗中每個像素的H上的值採樣,從而得到目標的色彩長條圖,將該長條圖儲存下來作為目標的色彩長條圖模型。在跟蹤過程中,對視頻影像處理地區中的每一個像素,通過查詢目標的色彩長條圖模型,可以得到該像素為目標像素的機率,影像處理地區之外的其他地區作為機率為0的地區。經上述處理,視頻映像轉換為目標色彩機率分布圖,也稱為目標顏色投影圖。為便於顯示,將投影圖轉化為8位的灰階投影圖,機率為1 的像素值設為255,機率為0的像素值為0,其他像素也轉換為相應的灰階值。所以,灰階投影圖中越亮的像素表明該像素為目標像素的可能性越大。
圖中虛線標示的部分是CamShift演算法的核心部分,主要目標是在視頻映像中找到運動目標所在的位置,這一部分被稱為Mean Shift演算法。由於Mean Shift是CamShift的核心,所以正確理解MeanShift就成了理解CamShift演算法的關鍵,下面就重點討論Mean Shift演算法。
2、混合高斯模型
背景中當樹葉在搖動時,它會反覆地覆蓋某像素點然後又離開,此像素點的值會發生劇烈變化,為有效地提取感興趣的運動目標,應該把搖動的樹葉也看作背景。這時任何一個單峰分布都無法描述該像素點的背景,因為使用單峰分布就表示己經假定像素點的背景在除了少量雜訊以外是靜止的,單模態模型無法描述複雜的背景。在現有效果較好的背景模型中有些為像素點建立了多峰分布模型(如混合高斯模型),有些對期望的背景映像進行預測,這些演算法的成功之處在於定義了合適的像素級穩態(Stationarity )準則,滿足此準則的像素值就認為是背景,在運動目標檢測時予以忽略。對於特定的應用情境,要想對特定演算法的弱點與優勢進行評價,必須明確這種像素級穩態準則。
對於混 亂的複雜背景,不能使用單高斯模型估計背景,考慮到背景像素值的分布是多峰的,可以根據單模態的思想方法,用多個單模態的集合來描述複雜情境中像素點值的變化,混合高斯模型正是用多個單高斯函數來描述多模態的情境背景。
混合高斯模型的基本思想是:對每一個像素點,定義K個狀態來表示其所
呈現的顏色,K值一般取3-5之間(取決於電腦記憶體及對演算法的速度要求),
K值越大,處理波動能力越強,相應所需的處理時間也就越長。K個狀態中每
個狀態用一個高斯函數表示,這些狀態一部分表示背景的像素值其餘部分則
表示運動前景的像素值。
本文來自CSDN部落格,轉載請標明出處:http://blog.csdn.net/tumblerman/archive/2009/04/03/4025627.aspx