計算機視覺(筆記)
計算機視覺就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。
機器視覺需要圖象訊號,紋理和顏色建模,幾何處理和推理,以及物體建模。實現影象理解是計算機視覺的終極目標。
物理是與計算機視覺有著重要聯絡的另一領域,計算機視覺關注的目標在於充分理解電磁波——主要是可見光與紅外線部分——遇到物體表面被反射所形成的影象。另一個具有重要意義的領域是神經生物學,人們試圖建立人工系統,使之在不同的複雜程度上模擬生物的視覺運作。計算機視覺的另一個相關領域是訊號處理,很多有關單元變數訊號的處理方法,尤其是對時變訊號的處理,都可以很自然的被擴充套件為計算機視覺中對二元變數訊號或者多元變數訊號的處理方法。
到目前為止,還沒有某個單一的方法能夠廣泛的對各種情況進行判定:在任意環境中識別任意物體。現有技術能夠也只能夠很好地解決特定目標的識別,比如簡單幾何圖形識別,人臉識別,印刷或手寫檔案識別或者車輛識別。而且這些識別需要在特定的環境中,具有指定的光照,背景和目標姿態要求。
計算機視覺系統的結構形式很大程度上依賴於其具體應用方向。有些功能卻幾乎是每個計算機系統都需要具備的:
1.影象獲取
一幅數字影象是由一個或多個影象感知器產生,這裡的感知器可以是各種光敏攝像機,包括遙感裝置,X射線斷層攝影儀,雷達,超聲波接收器等。取決於不同的感知器,產生的圖片可以是普通的二維影象,三維圖組或者一個影象序列。圖片的畫素值往往對應於光在一個或多個光譜段上的強度(灰度圖或彩色圖),但也可以是相關的各種物理資料,如聲波,電磁波或核磁共振的深度,吸收度或反射度。
2.預處理
在對影象實施具體的計算機視覺方法來提取某種特定的資訊前,一種或一些預處理往往被採用來使影象滿足後繼方法的要求。例如:
二次取樣保證影象座標的正確;
平滑去噪來濾除感知器引入的裝置噪聲;
提高對比度來保證實現相關資訊可以被檢測到;
調整尺度空間使影象結構適合區域性應用。
3.特徵提取
從影象中提取各種複雜度的特徵。例如:
線,邊緣提取;
區域性化的特徵點檢測如邊角檢測,斑點檢測;
更復雜的特徵可能與影象中的紋理形狀或運動有關。
4.檢測分割
在影象處理過程中,有時會需要對影象進行分割來提取有價值的用於後繼處理的部分,例如
篩選特徵點;
分割一或多幅圖片中含有特定目標的部分。
5.高階處理
到了這一步,資料往往具有很小的數量,例如影象中經先前處理被認為含有目標物體的部分。這時的處理包括:
驗證得到的資料是否符合前提要求;
估測特定係數,比如目標的姿態,體積;
對目標進行分類。
高階處理有理解影象內容的含義,是計算機視覺中的高階處理,主要是在影象分割的基礎上再經行對分割出的影象塊進行理解,例如進行識別等操作。
相關推薦
計算機視覺(筆記)
計算機視覺就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。 機器視覺需要圖象訊號,紋理和顏色建模,幾何處理和推理,以及物體建模。實現影象理解是計算機視覺的終極目標。
計算機視覺(一)概述
一、什麼是計算機視覺 計算機視覺(Computer Vision)是一門如何使計算機“看”的學問,讓攝像頭和電腦代替人眼對目標進行識別、跟蹤、測量等機器視覺。計算機視覺能夠模擬人類視覺的優越的能力,如識別物體、估計立體空間與距離、躲避障礙、理解影象、想象影象的能力,一定程度上,計算機視覺
計算機視覺(三):空間域濾波基礎
一、背景知識 1.空間域 2.運算元 3.變換函式 二、一些基本的灰度變換函式 1.影象反轉
計算機視覺(二):直方圖均衡
一、灰度空間的直方圖均衡 1.直方圖 2.變換函式應滿足條件 3.變換函式 4.直方圖均衡 二、彩色空間的直方圖均衡
計算機視覺(一):基礎篇
一、光和電磁波譜 二、彩色模型 1.RGB彩色模型 2.HSV彩色模型 3.從RGB到HSV的彩色轉換 4.從HSV到RGB的彩色轉換
計算機視覺(七):特徵檢測/提取(feature detection/extraction)
關鍵點檢測和匹配流水線四個階段 一、背景知識 1. 影象特徵 2. 數字函式的一階導數和二階導數 3. 導數與影象特徵關係 二
計算機視覺(六):頻率域濾波器
一、濾波器 1. 基本濾波公式 2. 濾波步驟 3. 低通濾波器與高通濾波器 二、低通濾波器(平滑影象)
計算機視覺(五):頻率域濾波基礎
一、數學預備知識 1. 傅立葉級數 二、基本概念 1. 頻率域 2. 複數 3. 尤拉公式
計算機視覺(四):空間域濾波器
一、平滑空間濾波器 1. 平滑線性濾波器(均值濾波器) 2. 統計排序(平滑非線性)濾波器 二、銳化空間濾波器
計算機視覺(八):影象分割
一、閾值處理 1. 基礎知識 2. 基本的全域性閾值處理 3. 用Otsu方法的全域性閾值處理 4. 用影象平滑改善全域性閾值處理 5. 利用邊
計算機視覺(二)
xtra roc 分類 match open 提取 水平 histogram svm 濾波和邊緣檢測 1. 空間濾波和頻域濾波 線性濾波和非線性濾波 滑動濾波: blur 和 boxfilter、高斯濾波器是真正的低通濾波器、與boxfilter相比沒有振鈴現象
計算機視覺(六)
影象檢索與相關應用 一。基於內容的影象檢索 分開展開: HOG SIFT: GIST: CNN: 最近鄰問題: 區域性敏感的雜湊:在高維空間和低維空間去保持距離
計算機視覺(七)
影象描述: Demo: https://vimeo.com/146492001 http://cs.stanford.edu/people/karpathy/neuraltalk2/demo.html 二。最新的方法概述: 1. Neur
計算機作業系統(筆記)
答:(1)、平臺原因(移植原因):不是所有的硬體平臺都能訪問任意地址上的任意資料的;某些硬體平臺只能在某些地址處取某些特定型別的資料, 否則丟擲硬體異常。 (2)、效能原因:資料結構(尤其是棧)應該儘可能地在自然邊界上對齊。訪問未對齊的記憶體,處理器需要作兩次記憶體訪問,而對齊的記憶體訪問僅需要一 次訪問。
計算機視覺(四)
迴圈神經網路 1、迴圈神經網路使用的輸出為什麼不是得分最大的而是其概率分佈:這樣更具有多樣性,相同輸入的情況下使用概率分佈能得到更多樣的輸出,這取決於第一個時間步的輸入。(這裡還有一個取樣的概念,這個還是不太懂) 2、反向傳播並非沿時間步整個進行傳播,而是通
計算機視覺(1)影象預處理
RGB顏色空間 加法混色空間 越疊加越白 一個畫素的顏色值(b,g,r)範圍:【0,255】 【0,1】CMYK顏色空間減法混色 越疊加越黑 4個維度來構成HSV顏色空間 色調,飽和度,明度可以和RGB相互轉換CIE-XYZ顏色空間人眼睛對顏色的容忍度 灰度化:Gray=R*0.3+G*0.59+B*0.1
CS231n: 深度學習計算機視覺(中文版)
CS231n官方筆記授權翻譯總集篇釋出 - 智慧單元 - 知乎專欄 CS231n課程筆記翻譯:線性分類筆記(中) - 杜客的文章 - 知乎專欄 CS231n課程筆記翻譯:線性分類筆記(下) - 智慧單元 - 知乎專欄 CS231
計算機視覺(八):提取Cifar-10資料集的HOG、HSV特徵並使用神經網路進行分類
1 - 引言 之前我們都是將整張圖片輸入進行分類,要想進一步提升準確率,我們就必須提取出圖片更容易區分的特徵,再將這些特徵當做特徵向量進行分類。在之前我們學了一些常用的影象特徵,在這次實驗中,我們使用了兩種特徵 梯度方向直方圖(HOG) 顏色直方圖(HSV)
計算機視覺(七):構建兩層的神經網路來分類Cifar-10資料集
1 - 引言 之前我們學習了神經網路的理論知識,現在我們要自己搭建一個結構為如下圖所示的神經網路,對Cifar-10資料集進行分類 前向傳播比較簡單,就不在贅述 反向傳播需要注意的是,softmax的反向傳播與之前寫的softmax程式碼一樣。神經網路內部的反向傳播權重偏導就是前面
計算機視覺(六):使用Softmax分類Cifar-10資料集
1 - 引言 這次,我們將使用Softmax來分類Cifar-10,過程其實很之前使用的SVM過程差不多,主要區別是在於損失函式的不同,而且Softmax分類器輸出的結果是輸入樣本在不同類別上的概率值大小,Softmax分類器也叫多項Logistic迴歸 線性模型: