電腦視覺基礎2——相機成像的幾何描述_電腦視覺

來源:互聯網
上載者:User

試想像一下,很多遊客同時在不同角度拍攝Eiffel Tower(埃菲爾鐵塔),該如何用數學的方法來描述這一過程呢。首先要解決的問題就是定位,或者說座標選定的問題,埃菲爾鐵塔只有一座,如果按經、緯度來刻畫,它的座標是唯一確定的,但遊客顯然不關係這一點,他(她)只按自己的喜好選擇角度和位置,因此,物體(景物)有物體的座標系統,相機有相機的座標系統,即便同一個相機,當調整參數時,在同樣的位置、相同的角度,也可能得到不同的映像。為了統一描述,有必要引入全局座標(或物體座標)、相機座標和像平面座標。

全局座標用UVW記。

相機座標用XYZ記。中學物理告訴我們,物體與像是倒的關係,但作為數學分析,我們採用虛像。像平面用xoy記。

而數位影像用(u,v)來表示,不弄混淆像平面和數位影像這兩個概念,同一個像通過平移、展開等,可以得到不同的數學映像(u,v)。

總體來看,就是

我們需要用數學的語言來描述這一過程。先看中間部分。

紅框標註的部分是3D物體到2D像平面的透視投影(如果不明白透視投影的概念,需要補一下高等幾何)

顯然,OP上的任一點的像都是p(x,y),為了描述這一關係,需要引入齊次座標。

By convention, we specify that given (x’,y’,z’) we can recover the 2D point (x,y) as

x=\frac{x^'}{z^'}x=\frac{x^'}{z^'}     y=\frac{y^'}{z^'}y=\frac{y^'}{z^'}    

Note: (x,y) = (x,y,1) = (2x, 2y, 2) = (k x, ky, k)

關於齊次座標,更詳細的介紹可參考高等幾何。

上述透視投影的過程可以描述為

正如開頭所言,不同遊客會選擇不同的位置和角度拍攝同一物體,因此,物體對於相機的關係各不相同,這就是物體到相機座標變換的問題。

上述紅框部分描述的是從物體的座標(稱為全局座標)到相機座標變換的過程,它是一種剛體運動,可以用平移、旋轉來描述。

上圖表示的是從全局座標變換到相機座標:Pc=R(Pw−C)Pc=R(Pw−C),寫成矩陣形式

平移是容易理解的,我們先討論更簡單的情形,即假設全局座標系和相機座標系的原點重合,則變換隻剩下旋轉了。

旋轉矩陣的元素也很容易確定。試想(U,V,W)=(1,0,0),而它在相機座標系中的座標是(X,Y,Z)=(a,b,c)(同一物理點的不同座標)則有:

因此有:

由於該旋轉是剛體運動,因此它是正交變換,滿足R−1=RTR−1=RT,所以有:

不難得出:

看一個例子:

由於物體的座標到相機座標的變換,相對於相機內部參數而言屬於外部參數(External Parameters),往往寫作R和T,即

總結

本小節講述了如何將3D全局座標系中的點變換到相機座標系中,然後經透視投影,變成2D像平面上的點(x,y).


總結:這個比第一節要難理解些,設計到一些矩陣變換,三維到二維資訊的變換。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.