AAM (Active Appearance Model)是廣泛應用於模式識別領域的一種特徵點提取方法[26]。基於 AAM 的人臉特徵定位方法在建立人臉模型過程中,不但考慮局部特徵資訊,而且綜合考慮到全域形狀和紋理資訊,通過對人臉形狀特徵和紋理特徵進行統計分析,建立人臉混合模型,即為最終對應的 AAM 模型。在映像的匹配過程中,為了能夠既快速又準確地進行人臉特徵標定,在對被測試人臉對象進行特徵點定位時採取一種映像匹配擬合的方法,可形象概括為“匹配→比較→調整再匹配→再比較”的過程。AAM 是隨著相關領域的發展不斷成熟起來的,關於 AAM 模型的研究可分為以下三個重要階段: 第一階段,Snake 演算法。AAM 思想的最初產生可追溯到 1987 年 Kass 等人提出的 Snake演算法,它是一種主要用於邊界檢定與映像分割的方法。該方法用一條由n 個控制點組成的連續閉合曲線作為 Snake 模型,再用一個能量函數作為匹配度的評價函數。用該方法進行特徵定位時,首先將模型設定在目標對象預估位置的周圍,再通過迭代使能量函數最小化,當內外能量達到平衡時即得到目標對象的邊界與特徵。Snake 方法提出的利用模型和能量函數進行匹配的思想是 AAM 思想的最初來源。 第二階段,可變模板。1989 年由 Yuille等人提出使用參數化可變模板來定位特徵。該方法同樣使用了一個能量函數作為匹配度評價函數,採用一種比 Snake模型複雜的方法,準確地表徵對象的形狀。在定位過程中,先將特徵的可變模板移動到被測對象的附近,再逐步完成對可變模板完成尺寸、偏轉角度以及位置和形狀的微調,通過設定不同的權值而最終實現能量函數的最小化。可變形模板的提出為 AAM 的產生奠定了理論基礎。 第三階段,ASM 和 AAM 演算法。1995 年由 Cootes 等人提出的主動形狀模型( Active Shape Model, ASM )是 AAM 的直接前身,ASM 演算法利用參數化的採樣形狀來構成對象形狀模型,並利用 PCA(Principal Component Analysis)方法建立描述形狀特徵點的運動模型,再利用一組參數來控制形狀特徵點的位置變化,從而獲得當前對象的形狀。但該演算法只單純利用了對象的形狀,因此準確率不高。1998 年,Cootes 等人在 ASM 演算法的基礎上首次提出 AAM的概念。 類似於 ASM,AAM 也是在對訓練資料進行統計分析的基礎上,首先建立人臉模型,然後利用先驗模型對映像中的目標物體進行匹配運算。與 ASM 的不同之處是它不僅利用圖形資訊,而且對重要的臉部紋理資訊也進行統計分析,並試圖找出形狀與紋理之間的聯絡。紋理資訊一般是對象的像素。 基於 AAM 的人臉特徵標定與識別有廣闊的應用領域,如新一代人機互動、人臉識別、人臉表情分析、人臉三維動畫建模、人臉映像編碼等等。 (1) 新一代人機互動。該技術通過捕捉、整合來自人臉面部映像、聲音、觸覺等多通道訊號來擷取人的身份、狀態、意圖等相關資訊,進而讓電腦主動為使用者服務。人臉是表徵人身份,傳遞狀態和意圖的重要途徑,最大限度地利用電腦視覺系統擷取人臉資訊,對新一代人機互動有重要意義。基於 AAM 的人臉特徵標定與識別演算法能快速準確地獲得人臉特徵點的位置,從而擷取人臉特徵資訊。 (2) Face Service。該技術是利用電腦分析人臉映像,進而從中提取有效識別資訊,用來“辨認”人臉對象的身份。目前Face Service的方法有很多,其中比較直觀、應用比較多的是基於特徵分析的方法,這種方法中一個關鍵步驟就是得到人臉面部的特徵資訊。基於 AAM 的人臉特徵標定與識別演算法能夠準確定位到面部器官的特徵點位置,因此在Face Service領域得到了廣泛應用。 (3) 人臉表情分析。該技術是對人臉的表情資訊進行特徵提取分析,利用人類所具有的情感資訊方面的先驗知識使電腦進行聯想、思考及推理,進而分析理解人的情緒,例如:快樂、驚奇、憤怒、恐懼、厭惡、悲傷等。基於特徵點的表情提取方法要求應用特徵點演算法進行標定,因此基於 AAM 的人臉標定與識別平台能為快速有效進行人臉表情分析做重要的基礎性工作。 (4) 人臉三維動畫建模。該技術是通過電腦圖形學手段,根據人臉面部的結構和屬性,構建與預期一致的虛擬人臉三維動畫模型。它要求能準確快速擷取人臉特徵資訊,這就離不開人臉特徵點定位技術。利用基於 AAM 的人臉標定與識別演算法,可利用 AAM 建模獲得形狀和表觀參數組,從而使人臉具有很強的表徵能力,且有利於快速重建對應原始人臉圖形的三維動畫模型。 (5) 人臉映像編碼。該技術是通過編碼技術將人臉圖形資訊進行有效地壓縮,並且編製成能在資訊媒介上傳輸的形式。基於 AAM 的人臉特徵匹配標定演算法能夠將人臉的紋理和圖形資訊利用相應維數較低的參數組來進行表徵,如果將參數組編碼後傳輸,然後重新構建人臉映像,也能實現映像傳輸的目的,對於這個網路資訊膨脹但是網路資源有限的時代來說無疑有更加重大的意義。 綜上所述,基於 AAM 的人臉特徵標定與識別方法已經成為了當今人臉特徵點定位領域裡一新興研究演算法,代表了未來發展方向的重要演算法之一,因此研究基於 AAM 的人臉特徵標定與識別方法具有重要意義。
AAM 演算法主要分為 AAM 建模和 AAM 匹配計算兩部分。AAM 建模所建立的模型是對象的主動表觀模型。所謂表觀模型,就是在 AAM 形狀模型的基礎上結合所提取人臉對象的紋理資訊建立起來的人臉模型;“主動”一詞則形象具體地體現在 AAM 匹配計算中。首先,採用 PCA(Principal Component Analysis)方法來描述形狀特徵點的動態變化,形狀特徵點表明了人臉特徵的位置;其次,以具體 AAM模型執行個體與輸入映像的均方差來定義一個能量函數,利用該能量函數來評價 AAM的匹配程度,在人臉定位匹配的過程中,根據模型的線性運算式通過有效匹配演算法變化模型參數組,從而控制形狀特徵點的位置變化來產生當前新的 AAM 模型執行個體;再次,利用當前得到的能量函數值來更新模型的參數,如此反覆迭代以實現能量函數的最小化,從而達到模型執行個體與輸入映像相匹配的目的,最終得到的形狀特徵點位置就描述了當前人臉映像的特徵點位置。AAM 的匹配演算法從最初的基於梯度下降演算法的匹配計算,發展到基於線性假定的 AAM 匹配計算,再到現在的基於 Lucas-Kanade 演算法的反向組合 AAM 匹配演算法,都在匹配精度和效率上有了很大提高。
AAM 建模是指建立對象的動態表觀模型,而 AAM 模型執行個體指將 AAM 的表觀模型通過仿射變換映射到對應的形狀執行個體中,從而得到描述當前對象的當前模型。AAM 建模在 AAM 中起著至關重要的基礎作用,本節分別從標定訓練集與形狀對齊、形狀建模、紋理建模和產生混合模型四部分來介紹 AAM 的建模過程 。