一、機器視覺與電腦視覺的區別與聯絡
在很多情況下,我們誤認為機器視覺就是電腦視覺,其實這是不準確的。何為機器視覺。何為電腦視覺。首先我們從定義著手,機器視覺其實就是用機器代替人眼進行測量和判斷。電腦視覺是利用電腦和其輔助裝置來類比人的視覺功能,實現對客觀世界的三維情境的感知、識別和理解。機器視覺和電腦視覺不僅是兩個不同的概念,而且側重點也不同。機器視覺側重工程的應用,強調即時性、高精度和高速度;而電腦視覺側重理論演算法的研究,強調理論,由於理論的研究發展速度往往快於實踐應用,也就是說電腦視覺的發展速度要遠遠超過了其時間生產的應用速度,因此電腦視覺的很多技術目前還難以應用到機器視覺上。但是二者還是共用一套理論系統,只是發展的方向不同而已,一個側重實際應用,一個側重理論演算法的研究,不能說誰替代誰,各有千秋。
二、近年來視覺發展的狀況和遇到的瓶頸
1、演算法瓶頸。機器視覺研究對象主要是映像和視頻,我們所採集的映像和視頻,其特點是大資料、冗餘資訊多、特徵空間維度高,同時考慮到真正的機器視覺面對的對象和問題的多樣性,單一的簡單特徵提取演算法(如顏色、空間朝向與頻率、邊界形狀等等)難以滿足演算法對普適性的要求,因此在設計普適性的特徵提取演算法時對計算能力和儲存速度的要求是十分巨大的,這就造成了開發成本的大幅度提高。
2、情境認知問題。如何讓機器認知這個世界。這一問題目前沒有成熟的答案,也是目前科學家一直在研究的熱點方向。早期的人工智慧理論發展經曆了符號主義學派、行為主義學派、串連主義學派等一系列的發展但都沒有找到令人滿意的答案,目前較新的思想認為應該從分析、瞭解和類比人類大腦的資訊處理功能去構建智能機器視覺系統,但神經科學的發展目前只能做到瞭解和類比大腦的一個局部,而不是整體(當然計算能力限制也是原因之一)。事實上,我們對人是如何對一個目標或情境進行認知的這一問題仍停留在定性描述而非定量描述上。
3、準確性問題。機器視覺系統經常被人詬病的問題之一就是準確性。以十年前如火如荼的Face Service演算法為例,儘管一系列看似優秀的演算法不斷問世,但目前為止那些演算法都是在指定的樣本庫中進行的,而在非指定大規模樣本庫下進行Face Service的準確率仍然無法滿足實際應用的需求,因此無法取代指紋或虹膜等近距接觸式生物識別特徵識別方法。這一問題的出現並非偶然。因為目標越精細,越複雜,資訊越大,則其模糊性和不確定性也越強。人類之所以能夠較好的對人臉進行識別,其實也是以犧牲一定的準確性為代價的。而機器視覺在做的事情一方面想要借鑒人腦或人眼系統的靈感去處理複雜而龐大的資訊流,另一方面又想摒除人腦在模式識別方面存在的精確性不足的缺陷。這顯然是一種一廂情願的做法。
4、魯棒性問題。相比與其他測量手段,視覺的最大優點就是可以快速獲得三維資訊,一張或幾張照片就可以重建出被測物體的三維特徵,進而實現測量。但正如我們所知道的,只要測量條件、環境、被測物表面特性等改變,有時甚至時稍加改變,結果則大不一樣,測量重複性和精度更無從談起。這也是目前機器視覺測量尺寸、位姿等參數時比較突出的問題,特別是在一些強光幹擾、溫度場變化、光照條件變化的應用場合這個問題尤為突出。
5、人才的缺少。目前真正意義上的從業人員缺少科班出身,缺少對影像處理的底層理論認知和理解。機器視覺中影像處理是極為重要的一環,而目前大多數從業人員是本科或者大專畢業,或者是電氣工程師新入行,基本都比較缺乏影像處理的基本理論。雖然相對於普通的自動化從業者而言,機器視覺工程師待遇還是不錯的,但是卻難以吸引到碩士或者博士進行過專門影像處理學術訓練的人加入,因為隨便加入那個互連網大公司做映像相關工作,待遇都能把自動化從業的工程師甩出幾條大街。另外,機器視覺更多的應用是屬於自動化裝置這一塊。而自動化屬於比較交叉的學科,涉及到機器視覺,需要瞭解的東西包括、電氣、運動控制、機械、光學、軟體編程等。這些學科瞭解一些基本的東西不難,但是研究的比較透徹並能高效率的綜合運用就比較難了。
目前的工業上視覺方面應用主要有:檢測、測量、識別和定位。而這幾個方面機器視覺還沒有一個能真正意義上實現批量化檢測的同時保證極高的準確率,極小的誤檢率和杜絕漏檢。這個目標不能實現,降低了機器視覺的應用預期。因為機器視覺裝置不能完全解決,還是需要人複查,除非客戶的標準沒有那麼高。這也導致目前機器視覺在工業上應用沒有那麼快普及的原因之一。為什麼機器視覺會遇到瓶頸。主要是過不了客戶那一關——高精度、高速度、高準確率,並且即時性還要好。
國內硬體核心組件(相機和鏡頭)和軟體演算法包還是老外的產品領先,國內也出現了一些替代產品,從效能上和老外PK還有很大的差距。
參考文獻
1、http://www.zhihu.com/question/20023867