一、四個座標系簡介
我覺得首先我們要理解相機模型中的四個平面座標系統的關係:像素平面座標系統(u,v)、映像物理座標第(x,y)、相機座標系(Xc,Yc,Zc)和全局座標系(Xw,Yw,Zw).
二、映像座標:我想和全局座標談談
玉米將在這篇博文中,對映像座標與全局座標的這場對話中涉及的第二個問題:談話方式,進行總結。全局座標是怎樣變換進攝像機,投影成映像座標的呢。
玉米做了一個簡單的圖示,在這裡做一個提綱。圖中顯示,全局座標系通過剛體變換到達攝像機座標系,然後攝像機座標系通過透視投影變換到達映像座標系。可以看出,全局座標與映像座標的關係建立在剛體變換和透視投影變換的基礎上。為了獎勵剛體變和透視投影變換溝通了“世界上最遠的距離”,玉米在圖上獎勵了他們兩朵小紅花。哈哈
首先,讓我們來看一下剛體變換是如何將全局座標系與映像座標系聯絡起來的吧。這裡,先對剛體變換做一個介紹:
剛體變換(regidbody motion):三維空間中, 當物體不發生形變時,對一個幾何物體作旋轉, 平移的運動,稱之為剛體變換。
因為全局座標系和攝像機座標都是右手座標系,所以其不會發生形變。我們想把全局座標系下的座標轉換到攝像機座標下的座標,如下圖所示,可以通過剛體變換的方式。空間中一個座標系,總可以通過剛體變換轉換到另外一個個座標系的。轉一轉,走一走,就到另外一個座標系下了。以前可能是面朝大海,經過平移旋轉,最終可能只能面朝冰山了,哈哈
下面讓我來看一下,二者之間剛體變化的數學表達。
其中,XC代表攝像機座標系,X代表全局座標系。R代表旋轉,T代表平移。R、T與攝像機無關,所以稱這兩個參數為攝像機的外參數(extrinsic parameter)可以理解為兩個座標原點之間的距離,因其受x,y,z三個方向上的分量共同控制,所以其具有三個自由度。
R則為分別繞XYZ三軸旋轉的效果之和。如下面所示:
R=r1*r2*r3.其由三個方向的θ控制,故具有三個自由度。
好了,剛體變換就講完了。大家應該都瞭解,全局座標繫到攝像機座標系之間的轉換過程了吧。
接下來,讓我們看看攝像機座標下的座標如何投影到映像座標系下,最終變為照片中的一個像素。這其中包含兩個過程:一是從攝像機座標到“空間映像座標”(x,y)所發生的透視投影;二是從“連續映像座標”到“離散映像座標”(u,v)。後者我們已經在第一篇博文中解釋過。所以在這裡,主要介紹一下透視投影。
透視投影(perspective projection): 用中心投影法將形體投射到投影面上,從而獲得的一種較為接近視覺效果的單面投影圖。有一點像皮影戲。它符合人們心理習慣,即離視點近的物體大,離視點遠的物體小,不平行於成像平面的平行線會相交於消隱點(vanish point)。
囉嗦這麼多,其實大家看看示意圖,看看公式,秒懂。
以圖中B(XB,YB)點為例,在小孔成像攝像機模型下(幾何分析的最常用模型)。這裡的f為攝像機的焦距,其屬於攝像機的內參數(intrinsic parameter)。其在成像平面上的投影點b(xb,yb)的座標利用簡單的相似三角形比例關係很容易求出:
上面兩式也闡明了攝像機座標與映像座標之間的透視投影關係。
好吧,現在玉米已經把映像座標與全局座標之間的這場對話所需經曆的三個波折的過程加以瞭解釋。即:剛體變換、透視投影、(x,y)換(u,v)(ps.這個在上一篇博文中講過)。接下來玉米用一張圖把三個過程串連起來。實現從全局座標(X,Y,Z)到(u,v)之間的轉換。讓映像座標與全局座標直接對話。
下圖中的轉換關係,都是用齊次座標表達的,大家會發現這樣的表達非常整潔。
其實這張圖顯示的過程還有一個名字:攝像機模型(camera model)。其實也就是攝像機的幾何模型了。
將三者相乘,可以把這三個過程和在一起,寫成一個矩陣:
P就是全局座標到映像座標的直接連絡人,P就表示了一個投影相機,有下面公式:
注意在表示齊次座標時,需要在符號上面加個小帽子。除去齊次座標控制位P23,P具有11個自由度。
攝像機模型及其中涉及的座標系等,是弄清3D重建幾何架構的基礎。可以把它們視為基本運算關係。後面對於三維重建幾何架構的推導,都是要用到三個基本座標系和攝像機模型的。