BoW模型用於映像檢索的一般化流程

來源:互聯網
上載者:User

--來自肉麻的開題報告

以經典BoW模型實現一個映像檢索的方法,BoW檢索的一般流程如圖2所示:


圖2  BoW檢索流程

最初的BoW在映像檢索中應用的流程主要分為以下幾步:

1、特徵提取。在訓練階段,將映像用很多“塊”(patch)表示,以SIFT特徵為例,映像中每個關鍵點就是一個patch,每一個patch特徵向量的維數128。

2、字典構建。假設共有M幅訓練映像,字典的大小為100,即有100個詞,用K-均值演算法對所有的patch進行聚類,等k-均值收斂時,將得到每一個聚類最後的質心,這100個質心(維數128)就是詞典裡的100個詞,詞典構建完畢。

3、字典表示。在測試階段,對每幅映像初始化一個維數100、值全為0的長條圖,計算測試映像每個patch與字典中單詞的距離,距離patch最近的單詞對應的長條圖計數加1,將所有patch計算完畢後的長條圖即為映像的字典表示。

4、映像檢索。訓練圖與測試圖都以100維向量表示,對每個待檢索映像,只需在字典中計算所有訓練圖與其距離,並返回最近的若干幅即可。 特徵提取是演算法的開始,也在很大程度上決定了演算法的效能。

PS:1.該圖參考的是LiFeiFei2006年的資料,原圖是用於object recognition的;

2.培訓完過後開始總結特徵;

3.實驗Gabor特徵+LDA;


from: http://blog.csdn.net/polly_yang/article/details/8241471

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.