一. 理論和方法介紹
a) 採用顏色檢索方法的目的:
對多媒體資料的檢索,早期的方法是用文本將多媒體資料進行標識,這顯然不是基於多媒體資訊本身內容的檢索,對多媒體資料中包含的資訊是一中及大的浪費;
基於內容的檢索是多媒體資料庫的關鍵技術,如何?這塊技術,是值得商榷的,而最好的方法是使用無需領域知識的檢索方法,因此,基於顏色的方法就是實現的關鍵;
本文介紹了顏色長條圖和顏色對方法在基於內容檢索時的實現思路和理論;
其實顏色長條圖簡單來說,就是統計映像中具有某一特定顏色的象素點數目而形成的各顏色的長條圖表示,不同的長條圖代表不同圖片的特徵。
b) 利用顏色長條圖進行檢索:
該方法也可以應用於視頻資料庫的查詢中,有以下三種方式:
(1)指明顏色組成--該法需要使用者對映像中的顏色非常敏感,而且使用起來也不方便,檢索的查准率和查全率並不高,因此文章中並未介紹該法的實現思路
(2)指明一幅樣本映像--通過與使用者確定的映像的顏色長條圖的相似性匹配得到查詢結果,這是文章介紹的兩種方法的根本
(3)指明映像中一個子圖--分割映像為各個小塊,然後利用選擇小塊來確定映像中感興趣的對象的輪廓,通過建立更複雜的顏色關係(如顏色對方法)來查詢映像,該方法是文章的重心所在
c) 顏色長條圖實現思路的介紹:
兩圖片是否相似可以採用歐氏距離來描述:
Ed=(G,S)= (Ed越小相似性就越大)
檢索後,全圖長條圖的相似性的定量度量可以用如下公式表示:
Sim(G,S)=
(N為顏色級數,Sim越靠近1兩幅圖片越相似)
可以對上面2中的公式加改進對某些相對重要的顏色乘上一個權重,就可以做尋找某一前景或組合的查詢。
全圖的顏色長條圖演算法過於簡單,因此帶來很多問題,如:可能會有兩幅根本不同的映像具有完全一樣的顏色長條圖,不反映顏色位置資訊,這樣導致查准率和查全率都不高,因此問文章提出了一個改進,即將映像進行了分割,形成若干子塊,這樣就提供了一定程度的位置資訊,而且可以對含使用者感興趣的子塊加大權重,提高檢索的查詢智能性和查准查全率,相應的公式有,子塊Gij與Sij的相似性度量為:
(P為所選色彩空間的樣點數)
再引入子塊權重Wij,選取L個最大的Sim值作Simk(Gk,Sk),就有:
(Wk 的選取應根據映像的特點決定,可以使映像中間或使用者指定的地區權重大,以反映映像的位置資訊)
d) 顏色對實現思路介紹:
主要目的:藉助映像中相鄰子塊之間的顏色長條圖的配對建模,實現對映像中的具體對象的查詢,支援對象的移位、旋轉和部分變形;
顏色對方法特別適合於對邊界明顯的對象的查詢;
實現思路:計算使用者輸入映像的子塊長條圖片à使用者選定包含查詢對象的子塊à計算這些子塊與周圍相鄰的子塊的顏色對錶à將這些顏色對中差值小於某一域值的顏色對刪除以消除顏色雜訊à選取顏色對錶中數值最大的幾個顏色對做為圖片的代表特徵à搜尋靶心圖表像的每一子塊的顏色對錶尋找與這寫代表顏色對的匹配à統計單一匹配次數à若有某一比例以上的顏色對匹配到,映像即被檢索到。
相似性度量:
(N為所用查詢顏色對數目)
qj、gj:顏色對j在查詢映像Q和靶心圖表像G中出現的次數
查詢時顏色對的匹配應該是不精確的,應該允許的誤差為2%以內