【目標檢測】一、初始的R-CNN與SVM

阿新 • • 發佈：2021-06-24

1.流程

2.數學概念

SVM（Support Vector Machines），主要想找到分離一批資料的超平面，約定是，找到距離這個超平面最近的點做距離該點最遠的線（/面）。

支援向量（support vecotr）就是離超平面最近的點，SVM由此命名。

而規劃超平面涉及到核（Kernal）函式概念，最終計算SVM會是解決不等式約束問題，這裡面就有多種方式。

（原始的SVM僅用於二分類，分類標籤按計算需求確定，可能是0和1，或者是-1和1，以此區分兩個類別。多種分類需要動刀函式距離）

對於一個二維平面來說，如果能用一條直線區分出兩批資料，那麼如何確定這條直線呢（可能會有多條），

SVM原則是找到兩批資料中點距離目標線最近的點，距離最大的解。這聽起來有很多個未知數

已知點A，假設超平面表示式（目標函式）為，那麼點A對y的距離（推導過程讓人腦閉，有需要再深究）：

這個yi是取-1和1的標籤值，注，yi的i不同書寫在了不同位置（上標或下標），但都是表示標籤。

為了下文計算方便，把分子拎出來，為了掉絕對值，此處新增變數yi（表示標籤值，i = 1,2,3,..n，表示第幾個資料）[2]，

yi取-1或1，以使分子結果不變，

設定下式為函式距離（或稱為函式間隔），可以表示點到超平面的距離遠近。

目標是找到函式距離最小值，

下一步是求距離超平面最近的點對超平面的距離最大化之解：

優化問題，分成兩個整體來處理，

已知要求的函式間隔最小，那麼有：

整理一下，

又不影響margin取值，此處可令其為1，（？[2]筆者並不太明白），

求||w||最小值等價於||w||²/2的最小值，為了求導方便，上式可轉化為：

為了求解線性可分支援向量機的最優化問題，將它作為原始最優化問題，

應用拉格朗日對偶性，通過求解對偶問題(dual problem)得到原始問題(primal problem)的最優解，這就是線性可分支援向量機的對偶演算法，

這樣做的優點：一是對偶問題往往更容易求解；二是自然引入核函式，進而推廣到非線性分類問題。----《統計學習方法》

關於如何求解拉格朗日此處不敘述，詳見[2][3]，

拉格朗日乘數法式子：

省略化簡，得到約束：

注，尖括號表示向量內積（也即點積）。

由於此時假設資料100%線性可分，然而真實資料並不都是那麼“乾淨”，此處引入鬆弛變數（slack variable），以允許有些資料點處於分隔面錯誤的一側，約束條件變為：C≥α ≥ 0 ，

如何求解，傳統地有二次規劃求解（quadratic solver），但是這個計算量大，John Platt釋出了一個叫SMO（Sequential Minimal Optimization，序列最小優化）的演算法以減少計算。

簡化的SMO虛擬碼：

建立一個α向量並將其初始化為0的向量

當迭代次數小於最小迭代次數時（外迴圈）：

對資料集中的每個資料向量（內迴圈）：

　　如果該資料向量可以被優化：

　　　　隨機選擇另外一個數據向量

　　　　同時優化這兩個向量

　　　　如何這兩個向量不能被同時優化，退出內迴圈

如果所有向量都沒被優化，增加迭代數目，繼續下一次迴圈

核（kernel）函式

如果一批資料並沒有呈現明顯的直線劃分規律，例如呈現環分佈的劃分規律，

那麼求解這個低緯度的非線性問題，最好就把它轉化成高緯度的線性問題，前者轉化到後者，這個對映過程用核函式滿足。

因為SVM的向量都是內積表示，這裡面把內積運算替換成核函式的方式，就叫做核技巧（kernel trick）或核變電（kernel substation）。

徑向基核函式（Radial Basis Function），是某種沿徑向對稱的標量函式，是一個常用的度量兩個向量距離的核函式。

例如，線性問題，是，非線性問題，假設核函式取徑向基函式的高斯版本：

（？）其中，σ是使用者定義的用於確定到達率（reach）或者說函式值跌落到0的速度引數。

def kernelTrans(X, A, kTup):
m,n = shape(X)
K = mat(zeros((m, 1)))
if kTup[0] == ’lin’ : K = X*A.T
elif kTup[0] == ‘rbf’ :
    for j in range(m):
        deltaRow = X[j, :] – A  # 公式
        K[j] = deltaRow*deltaRow.T  # 平方
    K = exp(K / (-1*kTup[1]**2))  # 元素間的除法
else : raise NameError(‘That Kernel is not recognizaed~~’)
return K

class optStruct:
def __init__(self, dataMatIn, classLabels, C, toler, kTup):
    self.X = dataMatIn
    ….
    self.m = shape(dataMatIn)[0]
    self.K = mat(zeros((self.m, self.m)))
    for i in range(self.m):
        self.K[:,i] = kernalTrans(self.X, self.X[i, :], kTup)

SVM用於數值型資料，視覺化分割超平面，其主要求解在於兩個變數的調優，幾乎所有分類問題都可以用SVM，

原始的SVM是一個二分類器，應對多類問題需要調整SVM，

但其核函式的選擇，以及核函式裡自定義變數的影響，使得這個最優解需要大量訓練。

=======================================================

資料：

[1] https://baike.baidu.com/item/拉格朗日乘數法/8550443?fromtitle=拉格朗日乘子法

[2] https://zhuanlan.zhihu.com/p/146515617

[3] https://blog.csdn.net/m0_37687753/article/details/80964472?spm=1001.2014.3001.5501

Peter Harrington著《機器學習實戰》

https://blog.csdn.net/m0_37687753/article/details/80964487

https://blog.csdn.net/laobai1015/article/details/82763033

https://baike.baidu.com/item/函式間隔/23224467?fr=aladdin

3.應用程式碼

現實中沒有使用到，暫且擱置。

【目標檢測】一、初始的R-CNN與SVM

1.流程 2.數學概念 SVM（Support Vector Machines），主要想找到分離一批資料的超平面，約定是，找到距離這個超平面最近的點做距離該點最遠的線（/面）。

【目標檢測】 IterDet模型簡介、TIDE評價指標介紹

來源 | 極鏈AI雲（價效比最高的共享GPU算力平臺，雙十活動進行中 10.9-10.11，新人註冊可領取198元大禮包，價值100小時的免費使用時長，領取地址：https://cloud.videojj.com/）

【《你不知道的JS（中卷②）》】一、非同步：現在與未來

一、非同步：現在與未來：如何表達和控制持續一段時間的程式行為，是使用類似JS這樣的語言程式設計時，很重要但常常被誤解的一點。

【開源專案】一、最美的Vue+Element開源後臺管理UI

作者：EuiAdmin 原文：http://suo.im/5AkUrQ 前言： EuiAdmin是基於Vue+Element等元件聯合開發的一個免費的開源後臺，你可以通過（euiadmin.com）進行下載和體驗，此後臺免費開源，你可以直接可以免費使用

【目標檢測】目標檢測演算法評估指標(效能度量) AP，mAP 詳細介紹

參考論文：《A Survey on Performance Metrics for Object-Detection Algorithms》對應Github：https://github.com/rafaelpadilla/Object-Detection-Metrics

【Flink原始碼】一、客戶端任務提交原始碼

一、Flink核心解析，針對版本1.12.0，四大塊：任務的提交流程，元件通訊，任務的排程，記憶體管理。

【效能測試】一、哪那麼多概念，不就是這一條嗎？

網上一搜效能測試，就會出現很多諸如效能測試、負載測試、壓力測試、強度測試等一堆專有名詞的解釋。

【推薦系統】一、推薦系統簡介

1. 推薦系統的作用和意義在這個時代，無論資訊消費者還是資訊生產者都面臨巨大的挑戰。

【SpringBoot-In-Action】一、Spring Boot快速入門

本系列教程根據本人實際學習使用 SpringBoot2.x 過程總結整理而來。 1、Spring Boot 簡介

【重溫msql】2、一條 sql 在 MySQL 中是如何執行的？

我們的程式通過連線池向 MySQL 傳送了一條sql語句，MySQL 就按照要求給我們返回了正確的結果，有時我們不免好奇，這個過程中究竟發生了什麼？它是如何工作的？有什麼方法可以加速我們的查詢？需要解答這些疑問，首先

【Java必修課】一圖說盡排序，一文細說Sorting(Array、List、Stream的排序)

簡說排序排序是極其常見的使用場景，因為在生活中就有很多這樣的例項。國家GDP排名、奧運獎牌排名、明星粉絲排名等，各大排行榜，給人的既是動力，也是壓力。

【深度學習：目標檢測】1.1 Faster RCNN理論合集

1. R-CNN簡介 2014年之前都是使用傳統方法進行目標檢測，準確率僅30%左右，R-CNN出現後提升了30%的準確率。

【Python爬蟲筆記】一、驗證碼識別

技術標籤：【Python】一、OCR技術 OCR（Optical Character Recognition，光學字元識別）是指電子裝置（例如掃描器或數碼相機）檢查紙上列印的字元，通過檢測暗、亮的模式確定其形狀，然後用字元識別方法將形狀

【spring原始碼分析】一、BeanPostProcessor

在spring-beans中org.springframework.beans.factory.config.BeanPostProcessor BeanPostProcessor也稱為Bean後置處理器，它是Spring中定義的介面，在Spring容器的建立過程中（具體為Bean初始化前後）會回撥BeanPost