計算機視覺基礎2——相機成像的幾何描述

阿新 • • 發佈：2019-01-03

試想像一下，很多遊客同時在不同角度拍攝Eiffel Tower(埃菲爾鐵塔)，該如何用數學的方法來描述這一過程呢？首先要解決的問題就是定位，或者說座標選定的問題，埃菲爾鐵塔只有一座，如果按經、緯度來刻畫，它的座標是唯一確定的，但遊客顯然不關係這一點，他(她)只按自己的喜好選擇角度和位置，因此，物體(景物)有物體的座標系統，相機有相機的座標系統，即便同一個相機，當調整引數時，在同樣的位置、相同的角度，也可能得到不同的影象。為了統一描述，有必要引入世界座標(或物體座標)、相機座標和像平面座標。

世界座標用UVW記。

相機座標用XYZ記。中學物理告訴我們，物體與像是倒的關係，但作為數學分析，我們採用虛像。像平面用xoy記。

而數字影象用(u,v)來表示，不弄混淆像平面和數字影象這兩個概念，同一個像通過平移、拉伸等，可以得到不同的數學影象(u,v)。

總體來看，就是

我們需要用數學的語言來描述這一過程。先看中間部分。

紅框標註的部分是3D物體到2D像平面的透視投影(如果不明白透視投影的概念，需要補一下高等幾何)

顯然，OP上的任一點的像都是p(x,y)，為了描述這一關係，需要引入齊次座標。

By convention, we specify that given (x’,y’,z’) we can recover the 2D point (x,y) as

x=\frac{x^'}{z^'}

x=\frac{x^'}{z^'} y=\frac{y^'}{z^'}y=\frac{y^'}{z^'}

Note: (x,y) = (x,y,1) = (2x, 2y, 2) = (k x, ky, k)

關於齊次座標，更詳細的介紹可參考高等幾何。

上述透視投影的過程可以描述為

正如開頭所言，不同遊客會選擇不同的位置和角度拍攝同一物體，因此，物體對於相機的關係各不相同，這就是物體到相機座標變換的問題。

上述紅框部分描述的是從物體的座標(稱為世界座標)到相機座標變換的過程，它是一種剛體運動，可以用平移、旋轉來描述。

上圖表示的是從世界座標變換到相機座標：P

c=R(Pw−C)Pc=R(Pw−C)，寫成矩陣形式

平移是容易理解的，我們先討論更簡單的情形，即假設世界座標系和相機座標系的原點重合，則變換隻剩下旋轉了。

旋轉矩陣的元素也很容易確定。試想(U,V,W)=(1,0,0)，而它在相機座標系中的座標是(X,Y,Z)=(a,b,c)(同一物理點的不同座標)則有：

因此有：

由於該旋轉是剛體運動，因此它是正交變換，滿足R−1=RT，所以有：

不難得出：

看一個例子：

由於物體的座標到相機座標的變換，相對於相機內部引數而言屬於外部引數(External Parameters)，往往寫作R和T，即

總結

本小節講述瞭如何將3D世界座標系中的點變換到相機座標系中，然後經透視投影，變成2D像平面上的點(x,y).

總結：這個比第一節要難理解些，設計到一些矩陣變換，三維到二維資訊的變換。

計算機視覺基礎2——相機成像的幾何描述

試想像一下，很多遊客同時在不同角度拍攝Eiffel Tower(埃菲爾鐵塔)，該如何用數學的方法來描述這一過程呢？首先要解決的問題就是定位，或者說座標選定的問題，埃菲爾鐵塔只有一座，如果按經、緯度來刻畫，它的座標是唯一確定的，但遊客顯然不關係這一點，他(她)只按自己的喜好

雙目立體視覺學習2——雙目成像原理

為什麼一隻眼睛看不出來距離？見下圖：紅線上的點都投影到下面的攝像頭，分不清遠近。但是通過綠色的線，就可以確定是哪一點了。雙目相機立體成像的原理：其中，y是垂直於平面向外的方向。p是空間的一點，xl xr兩個綠點是p點在攝像頭內的成像。可以得到：

計算機視覺基礎之相機標定

昨天完成了用最小二乘法進行相機標定的實驗。 1. 最小二乘法進行相機標定的原理 1.1 座標系變換將實物拍到相機的膠片上需要進過幾個座標系的變換：世界座標系—>相機座標系—成像座標系—>畫素座標系在座標系變換的過程中可以看做是將變換矩陣線性作用於齊次向量

計算機視覺基礎——對極幾何(Epipolar Geometry)

先思考一個問題：用兩個相機在不同的位置拍攝同一物體，如果兩張照片中的景物有重疊的部分，我們有理由相信，這兩張照片之間存在一定的對應關係，本節的任務就是如何描述它們之間的對應關係，描述工具是對極幾何，它是研究立體視覺的重要數學方法。　　要尋找兩幅影象之間的對應關係，最直接

影象處理與計算機視覺基礎、經典以及最近發展

******************************************************************************************************************************************************

計算機視覺基礎——TensorFlow實經典LeNet網路

一、LeNet網路簡介 1.1 LeNet網路的背景閃光點：定義了CNN的基本元件，是CNN的鼻祖。 LeNet是卷積神經網路的祖師爺LeCun在1998年提出，用於解決手寫數字識別的視覺任務。自那時起，CNN的最基本的架構就定下來了：卷積層、池化層、全連線層。如今各大

計算機視覺基礎~影象預處理（中）

5.1梯度Prewitt濾波/卷積水平梯度/垂直邊緣垂直梯度/水平邊緣 5.2梯度Sobel濾波/卷積梯度Sobel濾波/卷積垂直梯度/水平邊緣 5.3梯度Laplacian濾波/卷積二

從零開始一起學習SLAM | 相機成像模型

上一篇文章《從零開始一起學習SLAM | 為啥需要李群與李代數？》以小白和師兄的對話展開，受到了很多讀者的好評。本文繼續採用對話的方式來學習一下相機成像模型，這個是SLAM中極其重要的內容，必須得掌握哦~ 小白：師兄，上次聽你講了李群李代數，有種“聽君一席話勝讀十年書”的趕腳~後來看書感覺容易理解多了呢！師

計算機視覺系列-2-影象分類

給定一張輸入影象，影象分類的任務是判斷該影象屬於哪類, 如果是多工分類, 可以用於分類該影象包含哪個類別。深度學習作為機器學習中非常重要的分支, 在影象領域中應用非常廣泛. 在影象分類任務中, 通常採用卷積層(CNN)提取特徵, 加上全連線層進行分類,

影象處理與計算機視覺基礎、經典以及最近發展

影象處理與計算機視覺基礎，經典以及最近發展

影象處理與計算機視覺基礎，經典以及最近發展(一)

在小波變換之前，時頻分析的工具只有傅立葉變換。眾所周知，傅立葉變換在時域沒有解析度，不能捕捉區域性頻域資訊。雖然短時傅立葉變換克服了這個缺點，但只能刻畫恆定視窗的頻率特性，並且不能很好的擴充套件到二維。小波變換的出現很好的解決了時頻分析的問題，作為一種多解析度分析工具，在影象處理中得到了極大的發展和應用。在小

計算機視覺基礎5——本質矩陣與基本矩陣(Essential and Fundamental Matrices)

回顧本質矩陣的定義本質矩陣的基本性質：結合成像的幾何關係　　　　　　 Longuet-Higgins equation 注意大小寫的區別哦，大小表示物點向量，小與表示像點向量。像平面上的一點可以看作： • (u,v) 2D film

【Compute Vision】影象處理與計算機視覺基礎，經典以及最近發展

**************************************************************************************************************************************

影象處理與計算機視覺基礎，經典以及最近發展(二)

背景建模一直是視訊分析尤其是目標檢測中的一項關鍵技術。雖然最近一直有一些新技術的產生，demo效果也很好，比如基於dynamical texture的方法。但最經典的還是Stauffer等在1999年和2000年提出的GMM方法，他們最大的貢獻在於不用EM去做高斯擬合，而是採用了一種迭代的演算法，這樣就不需要

計算機視覺基礎

計算機視覺基礎文章目錄計算機視覺基礎畫素 RGB三原色顏色組成圖片的高和寬畫素畫素影象的最小單元。在計算機中畫素的值通常是用8位的無符號整型表示，取值範圍是0-255

影象處理與計算機視覺基礎相關領域的經典書籍以及論文

我非常感謝原作者楊曉冬辛勤地編寫本文章，並願意共享出來。我也希望轉載本文的各位朋友，要註明原作者和出處，以尊重原作者！一、緒論 1. 為什麼要寫這篇文章從2002年到現在，接觸影象快十年了。雖然沒有做出什麼很出色的工作，不過在這個領域摸

【計算機視覺】影象處理與計算機視覺基礎，經典以及最近發展

在這裡，我特別宣告：本文章的源作者是楊曉冬（個人郵箱：[email protected]）。原文的連結是 http://www.iask.sina.com.cn/u/2252291285/ish。版權歸楊曉冬朋友所有。

[計算機視覺] CImg庫繪製圖像灰度直方圖

做計算機視覺Computer Vision作業時候要用CImg庫（即CImg.h標頭檔案），需要繪製圖像的灰度直方圖。網上搜索了一下貌似都沒找到相關的連結，只好屁顛屁顛的開啟5w多行的CImg.h檢視

【計算機視覺】【影象處理】幾何變換之仿射變換（平移、縮放、旋轉）

1.概念詞語1）影象的幾何變換對影象進行放大、縮小、旋轉等操作，會改變原圖中各區域的空間關係，這類操作就是影象的幾何變換。2）仿射變換對原來的x和y座標分別進行線性的幾何變換，得到新的x和y，這種變換就是放射變換。3）投影變換4）極座標變換5）齊次座標

【計算機視覺】深度相機（一）--TOF總結

TOF技術採用主動光探測方式，與一般光照需求不一樣的是，TOF照射單元的目的不是照明，而是利用入射光訊號與反射光訊號的變化來進行距離測量，所以，TOF的照射單元都是對光進行高頻調製之後再進行發射，比如下圖所示的採用LED或鐳射二極體發射的脈衝光，脈衝可達到100MHz。與普通相機類似，TOF相機晶片前端需要一