《計算機視覺-一種現代方法（第2版）》讀書筆記五：高層視覺

阿新 • • 發佈：2019-02-17

本篇思維導圖

這裡寫圖片描述

影象配準(Registration)

1.配準剛性物體

變換：旋轉(rotation)、平移(translation)、縮放(scale)
∑i[(sR(θ)xi+t)−yc(i)]2
迭代最近點：通過估計對應點尋找正確的變換，然後估計基於對應點的變換，不斷重複
通過對應點搜尋變換：搜尋對應的區域性區域（圖形符號而不是點），使用它們來估計變換
應用：影象拼接(Image Masaics)

2.基於模型的視覺：用投影配準剛性物體

假設一個影象特徵集合與一個物體特徵集合對應，用這個對應關係產生一個從物體座標系到影象座標系的投影框架的猜測
使用這個投影假設來產生一個物體的影象，稱為反向投影

比較影象與所產生的物體影象，如果它們兩個足夠相似，就接受上述假設

3.配準可變形的物體

學習分類

1.分類、錯誤和損失

使用損失確定決策
訓練誤差、測試誤差和過擬合
正則化
錯誤率和交叉驗證
ROC曲線

2.主要的分類策略

2.1 兩大通用策略

明確的概率模型(可理解為生成模型，如樸素貝葉斯模型）
直接確定決策邊界（可理解為判別模型）

2.2 策略1：使用基於馬氏距離的正態類條件概率密度

這裡寫圖片描述
注：馬氏距離表示資料的協方差距離，它是一種有效計算兩個未知樣本集間相似度的方法。與歐式距離不同的是它考慮到各種特徵之間的聯絡，並且是尺度無關的。

該演算法的幾何解釋：在考慮方差情況下將資料項劃分到距類均值最近的類中（特別地，沿某一方向方差小的距類均值的距離有大權重，方差大的距類均值的距離權重小）
評價：在有很多訓練資料和類別的低維問題可以嘗試。馬氏距離的適用場景相對較少，因為當特徵向量是高維時求協方差矩陣比較困難。

2.3 策略2：類條件直方圖和樸素貝葉斯

如果有足夠的標記資料，就可以對類條件密度直方圖建模，這在低維情況下是有用的。

利用貝葉斯公式直接算出後驗概率然後進行比較

2.4 策略3：使用最近鄰的非引數分類器

對一個類別未知的樣本，可以假設其類別是在特徵空間中距離這個樣本最近的訓練樣本的類別，或找出距離待識別樣本最近的幾個，然後用這幾個訓練樣本的類別進行投票來確定待識別樣本的類別

這裡寫圖片描述
評價：這一策略總是有用的，當訓練資料很多時與其他分類方法相比也保持有競爭力。

2.5 策略4：線性SVM

線性可分情況
線性不可分情況

2.6 策略5：核SVM

這裡寫圖片描述

2.7 策略6：Boosting和Adaboost

集合多個弱分類器構造強分類器

3.建立分類器的實際方法

3.1 選擇分類器的經驗

經驗建議對大多數問題可以首先用線性SVM去嘗試，如果效果不理想，接下來換用核SVM或boosting方法

3.2 訓練資料處理的兩個技巧

資料增廣：縮放、裁剪、旋轉、翻轉等
bootstrapping(自助法)
- 基本思想：將被分類錯誤的正負樣本插入到訓練集中重新訓練分類器，反覆迭代
- 變體：hard negative mining
  從負樣本中選取出一些有代表性的負樣本(分類器檢測出的錯誤的正樣本，被稱作hard negative)，不斷重新訓練，使得分類器的訓練結果更好

3.3 從二分類器中建立多分類器

all-vs-all方法：為每類都建立一個分類器
one-vs-all方法：為每類和其餘類建立一個分類器（比all-vs-all方法往往要更可靠和有效一些）

3.4 求解SVM和核SVM

PEGASOS:原始SVM問題求解器
LIBSVM：對偶問題求解器，使用SMO演算法求解非零拉格朗日乘子
SVMLight:利用數值特徵的綜合SVM求解包

分類影象

基本思路：利用一個已標記的資料集，建立特徵，然後訓練分類器

1. 建立好的影象特徵

不同的特徵構建適用於不同的情況。關鍵是建立那些能暴露類間變化並且抑制類內變化的特徵。
任何一種特徵表示形式都應該是對影象的旋轉、平移或縮放魯棒的，因為這些變換並不會影響影象的含義

1.1 應用例子

檢測特定影象（如色情圖片識別）
材料分類
場景分類

1.2 用GIST特徵編碼佈局

GIST特徵綜合了一幅影象不同部分的梯度資訊（尺度和方向），提供了關於一個場景的粗略描述

對於場景分類一個自然的線索就是圖片的整體佈局，GIST特徵企圖捕獲的正是這種佈局。
GIST特徵的計算過程
1. 用32個Gabor濾波器（4個尺度，8個方向）卷積影象，產生32幅特徵圖
2. 把每個特徵圖等分成16個區域（4*4網格），求每個區域的特徵值均值
3. 連線所有32幅特徵圖的特徵均值，形成一個16*32=512維的GIST特徵

1.3 用視覺單詞(visual words)概況影象

記錄具有特點的區域性影象塊，用某些區域性特徵(如SIFT特徵)描述這些區域性鄰域並進行向量量化得到視覺單詞，然後通過直方圖的形式對視覺單詞集進行統計概括，如果在一幅影象中大多數單詞與另一幅影象中的大多數單詞匹配，它們的視覺單詞直方圖就會是相似的。
衡量直方圖的相似性，普遍採用的是直方圖的交距離：K(h,g)=∑imin(hi,gi)

1.4 空間金字塔核

是視覺單詞直方圖方法的一個重要變體，能產生可有效粗略編碼空間佈局的核

這裡寫圖片描述

模型

wl表示相匹配的grid權重，越精細的grid權重越大
應用
空間金字塔核在場景影象分類上做得很好，在標準影象分類任務上也要優於直方圖交核；它能夠很好地表示相對獨立的物體或自然場景，但對於缺少紋理的物體或與背景相似的物體會遇到麻煩

1.5 用主成分(PCA)降維

這裡寫圖片描述
PCA建立了在特定維數下最能表達原高維資料變化的新的特徵集，但是並不能保證這個特徵集能幫助我們實現有效分類。

1.6 用典型變數(canonical variates)降維

典型變數指能夠明顯地反映出不同類別樣本間差異的線性特徵，這些特徵能使類間儘可能分開
這裡寫圖片描述

2. 分類含有單個物體的影象

2.1 影象分類策略

通用策略是計算特徵，利用特徵向量構建多分類器
典型方法
- 使用HOG和SIFT特徵的變體，結合顏色特徵
- 視覺單詞字典（計算影象的視覺單詞，進行向量量化，用視覺單詞的直方圖表示影象然後使用直方圖交方法對其分類）
- 空間金字塔核金字塔匹配核

3. 影象分類實踐

3.1 關於影象特徵的程式碼

3.2 影象分類資料集

3.3 資料集偏差(bias)

指資料集的性質與真實世界的性質存在表示偏差

避免偏差的策略：
- 從多種不同的途徑收集大量資料
- 在使用資料集評估複雜方法前使用基本方法小心地評估資料集
- 採取與收集訓練資料不同的策略來收集資料，並通過評估它們來量化偏差的影響

《計算機視覺-一種現代方法（第2版）》讀書筆記三：早期視覺（一幅影象）

本篇思維導圖線性濾波器線性濾波器的主要策略是用不同的加權模式計算畫素加權和，以尋找不同的影象模式 1.線性濾波和卷積二維卷積公式：Rij=∑u,vHi−u,j−vFu,v,使用卷積核H將圖像F卷積到域R 幾種常見的線性濾波：平均平滑、

《計算機視覺-一種現代方法（第2版）》讀書筆記四：中層視覺

本篇思維導圖注：中層視覺主要關注的是影象中的幾何結構以及特定物件和目標，應用領域包括目標分割和跟蹤通過聚類分割分割的目的是為了得到一幅圖片中有用部分的一個精簡的表示，其具體的理論和方法取決於應用的需求 1 人類視覺：分類和格式塔(Gesta

《計算機視覺-一種現代方法（第2版）》讀書筆記一：導論大綱

前言作為CV（Computer Vision）方向的研究生，一直想要系統地瞭解和學習一下CV的基本知識，理清CV發展的脈絡。而David Forsyth的《Computer Vision-A Modern Approach(2nd edition)》是CV領

《計算機視覺-一種現代方法（第2版）》讀書筆記五：高層視覺

本篇思維導圖影象配準(Registration)1.配準剛性物體變換：旋轉(rotation)、平移(translation)、縮放(scale) ∑i[(sR(θ)xi+t)−yc(i)]2∑i[(sR(θ)xi+t)−yc(i)]2迭代最近點：通過估計對應點尋找正確的變換

《C語言程式設計：現代方法（第2版）（K.N.King 著）》學習筆記一：C語言概述

1.1 C語言的歷史 1.1.1 起源 C語言是美國貝爾實驗室的 Dennis Ritchie、Ken Thompson 等人為開發 UNIX 作業系統而於 1972 年設計的一種計算機程式語言。

《C語言程式設計：現代方法（第2版）（K.N.King 著）》學習筆記三：C語言基本概念（2）

2.3 註釋每一個程式都應該包含識別資訊，即程式名、編寫日期、作者、程式的用途以及其他相關資訊。C語言把這類資訊放在註釋（comment）中。符號 /* 標記註釋的開始，而符號 */ 則標記註釋

《C語言程式設計：現代方法（第2版）（K.N.King 著）》學習筆記四：C語言基本概念（3）

2.5 讀入輸入為了獲取輸入，就要用到 scanf 函式。它是C函式庫中與 printf 相對應的函式。scanf 中的字母 f 和 printf 中的字母 f 含義相同，都是表示“格式化”的意思

《C語言程式設計：現代方法（第2版）（K.N.King 著）》學習筆記五：C語言基本概念（4）

2.7 識別符號在編寫程式時，需要對變數、函式、巨集和其他實體進行命名。這些名字稱為識別符號（identifier）。在C語言中，識別符號可以含有字母、數字和下劃線，但是必須以字母或者下劃線開頭。

《C語言程式設計：現代方法（第2版）（K.N.King 著）》學習筆記六：C語言基本概念（5）

問與答 GCC 最初是 GNU C Compiler 的簡稱。現在指 GNU Compiler Collection，這是因為最新版本的 GCC 能夠編譯用 Ada、C、C++、Fortran、Ja

《C語言程式設計：現代方法（第2版）（K.N.King 著）》學習筆記九：格式化輸入/輸出（2）

3.2 scanf 函式就如同 printf 函式用特定的格式顯示輸出一樣，scanf 函式也根據特定的格式讀取輸入。像 printf 函式的格式串一樣，scanf 函式的格式串也可以包含普通字元

《計算機程序的構造和解釋（第2版）》【PDF】下載

ger car 教材推薦教育 5.5 系統 log nbsp 《計算機程序的構造和解釋（第2版）》【PDF】下載鏈接: https://u253469.pipipan.com/fs/253469-230382255 內容簡介《計算機程序的構造和解釋(原書第2

JavaScript入門經典（第四版）讀書筆記

utc 文件名 ttext 文檔開頭 rep 顯示部分 body 第一部分 Web腳本編寫與JavaScript語言的概念 1.document.lastModified（） -> 返回文檔修改日期 2.<head>標簽中的<sc

《 Spring 實戰》（第4版）讀書筆記

Pxx 表示在書的第 xx 頁。 Spring 框架的核心是 Spring 容器。 1. (P7.) 構造器注入是依賴注入的方式之一。緊耦合：在 A 類的無參構造器中直接 new 出一個 B 類。 Spring 鬆耦合：在 A 類中使用有參構造器，把 B 類的超類型

unix環境高階程式設計（第三版）-讀書筆記2

限制 unix系統實現定義了很多幻數和常量，其中有很多已被硬編碼到程式中，或用特定的技術確定。已下兩種型別是必須的。（1）編譯時限制（例如，短整型的最大值是什麼？）（2）執行時限制（例如，檔名有多少個字串？）編譯時限制可在標頭檔案中定義。程式在編譯時包含這些標頭檔案。但是執行

組合語言（第三版）讀書筆記 2

第2章暫存器前一章所說的匯流排，相對於CPU內部來說是外部匯流排。內部匯流排實現了CPU內部各個器件（運算器，控制器，暫存器）之間的聯絡，外部匯流排實現了CPU和主機板上其他器件的聯絡。不同的CPU，暫存器的個數、結構是不相同的。8086 CPU有14個暫存器

JavaScript入門經典（第7版）讀書筆記

斷斷續續看了十來天，終於看完了，還是學到些東西，這本書還是不錯的，各方面都有涉及。補充了下之前不完善的JS 知識筆記一般只記必要的東西。‎ Table of Contents 1. JavaScript 基礎 1.1. JavaScript 簡介

《黑客攻防技術寶典Web實戰篇@第2版》讀書筆記1：了解Web應用程序

金融主機 border ket 邊界輕量在線讀書目的讀書筆記第一部分對應原書的第一章，主要介紹了Web應用程序的發展，功能，安全狀況。 Web應用程序的發展歷程早期的萬維網僅由Web站點構成，只是包含靜態文檔的信息庫，隨後人們發明了Web瀏覽器用來檢索和

《人工智慧：一種現代方法》第17章複雜決策問題學習筆記

前言本篇文章來自Artificial Intelligence: A Modern Approach一書第17章“複雜決策問題”，進行了翻譯和整理，僅供學習參考。正文在之前的章節中討論了單個決策問題，這些問題特點是行動帶來的效用是完全知道的，而接下來討論的序貫決策問題，效用

計算機網路：自頂向下方法（第七版）Wireshark實驗指南

計算機網路：自頂向下方法（第七版）Wireshark實驗指南這個資源在網上好像很難找，我歷經千辛萬苦找到之後，在文件的內部發現這些文件其實是免費公開在一個網站上的……，連結如下： http://gaia.cs.umass.edu/wireshark-labs/?tdsourcetag=s_pcqq_ai

分享《OpenCV 3計算機視覺：Python語言實現（第2版）》中文PDF+英文PDF+原始碼

下載：https://pan.baidu.com/s/1gGgEk8Y6X58gfvsmD8U8Xw 更多資料分享：https://www.cnblogs.com/javapythonstudy/ 《OpenCV 3計算機視覺：Python語言實現（第2版）》中文PDF+英文PDF+原始碼中文PDF，20

《計算機視覺-一種現代方法（第2版）》讀書筆記五：高層視覺

本篇思維導圖

影象配準(Registration)

1.配準剛性物體

2.基於模型的視覺：用投影配準剛性物體

3.配準可變形的物體

學習分類

1.分類、錯誤和損失

2.主要的分類策略

2.1 兩大通用策略

2.2 策略1：使用基於馬氏距離的正態類條件概率密度

2.3 策略2：類條件直方圖和樸素貝葉斯

2.4 策略3：使用最近鄰的非引數分類器

2.5 策略4：線性SVM

2.6 策略5：核SVM

2.7 策略6：Boosting和Adaboost

3.建立分類器的實際方法

3.1 選擇分類器的經驗

3.2 訓練資料處理的兩個技巧

3.3 從二分類器中建立多分類器

3.4 求解SVM和核SVM

分類影象

1. 建立好的影象特徵

1.1 應用例子

1.2 用GIST特徵編碼佈局

1.3 用視覺單詞(visual words)概況影象

1.4 空間金字塔核

1.5 用主成分(PCA)降維

1.6 用典型變數(canonical variates)降維

2. 分類含有單個物體的影象

2.1 影象分類策略

3. 影象分類實踐

3.1 關於影象特徵的程式碼

3.2 影象分類資料集

3.3 資料集偏差(bias)

相關推薦