1. 程式人生 > >【svm學習筆記】svm_理論基礎4

【svm學習筆記】svm_理論基礎4

【線性不可分問題 之 核函式】

上面討論的都是線性可分問題,雖然最終也沒看到解的樣子或者解的方法,總之,我們假設已經可以解了。接下來,如果樣本線性不可分,咋整?

好辦。記得從前影象處理裡面有個小波變換,大概的意思就是時域效果不好的話,變換到復域效果就好了,變換的名稱我記得叫傅立葉變換。在這裡也是一樣。如果我們在某個樣本空間中找不到最優分類面,那麼我們就想辦法把他對映到高維空間去。前段時間很火的一部科幻小說叫做《三體》。在《三體2》的開場部分,有個女巫,能從封閉的空間中取物。原理就是,封閉的空間是三維空間,在三維空間是封閉的;而女巫能進入四維空間,一個在三維空間中封閉的區域,在四維空間中就不再是封閉的了。這裡也是,一些樣本在低維空間中不可分,但是對映到高維空間,就有可能被分開。這個維度有可能是非常高。拿文字分類為例,一般樣本點的特徵都是上萬維,即便這樣,仍然不可分,仍然需要向更高維的空間做對映。

那麼假設樣本在高維空間中可分了,我們也找到最優分類面了,對於一個新的樣本,我們如何分類呢?會有以下幾個步驟:

1. 將新樣本對映到高維空間中

2. 將所有支援向量也對映到高維空間中

3. 用上文中g(x)的計算公式(參見“svm_基礎理論3”)計算函式值

4. 對函式值進行判定,得出分類結果

這就引出了一個問題,如何對映到高維空間呢?對映到哪個高維空間呢?其實我們再回過頭來看看,我們計算的只是支援向量和樣本向量的內積,如果能直接計算出這個內積,其實可以不用“顯性地”向高維空間中對映。核函式就是這樣的工具。將公式中的內積運算換成內積的核函式運算,就可以了。

什麼樣的函式是核函式呢?

理論上,滿足Mercer條件的都是核函式。什麼是Mercer條件呢?對我們做工程的人來說,不用理會,我們自己創造不出什麼好的核函式,用現有的就行。

現有的有哪些核函式呢?

線性核、多項式核、RBF核、sigmod核。

對於一個新問題,選擇哪個好呢?

沒有標準答案,必須自己去嘗試。而且,對於具體問題,不同核函式的效能差別很大。

還有一個問題。原來我們想,將低維空間向高維空間對映,看樣本是否線性可分;如果不可分,繼續增加高維空間的維度,再進行對映,直到線性可分位置。不過我們現在有了麻煩,什麼呢?我們只有這幾個核函式,萬一用了他們幾個,發現還是線性不可分,如何是好?當然這幾個核函式也有引數,也可以調整。不過,更一般地說,如果仍然有少部分訓練樣本線性不可分,我們該怎麼辦?下節再講。


相關推薦

svm學習筆記svm_理論基礎4

【線性不可分問題 之 核函式】 上面討論的都是線性可分問題,雖然最終也沒看到解的樣子或者解的方法,總之,我們假設已經可以解了。接下來,如果樣本線性不可分,咋整? 好辦。記得從前影象處理裡面有個小波變換,大概的意思就是時域效果不好的話,變換到復域效果就好了,變換的名稱我記

svm學習筆記svm_理論基礎2

【線性可分問題 之 問題】 先從最簡單的情況說起,說線性可分問題。問題是這樣的,至少可以想象是這樣的:在二維空間中有一些點,分別屬於兩個不同的類別,如何在二維空間中找到這樣一條直線,直線的一邊是某一類別的點,直線的另一邊是另一個類別的點?如果這樣的直線存在多條,如何選擇一條

svm學習筆記svm_理論學習圖譜_上

這兩天,因為工作需要,斷斷續續在看svm的一些資料。因為之前也看過其他的一些機器學習模型,並動手實現過相關程式碼,如:最大墒模型等,所以最初以為學習svm的過程應該與上述經歷類似。事實證明,svm是個坑,進去容易,爬上來難。難的主要在於,svm本身是由多個不同方面的理論拼接

svm學習筆記svm_理論學習圖譜_下

接著上一篇說。 泛化理論幫我們解決了維數災難的問題,同時又指導我們找到了目標函式,將模型學習問題轉化成了有約束條件下的優化問題。那麼我們又知道,svm實際上是在高維空間學習一個超平面,那這個目標函式到底找到的是哪個超平面啊?這有引入了一些神馬函式間隔、幾何距離等東東。然後

Android學習筆記屬性動畫基礎學習筆記

屬性動畫 屬性動畫系統是一個具有魯棒性的框架,允許你幾乎讓一切都動起來。你能夠定義一個動畫來隨著時間改變任何物件的任何屬性,無視該物件是否是畫在在螢幕上的。屬性動畫在指定的時間內改變屬性值(某個物件的某個屬性)。為了讓目標動起來,需要特別指明所要運動的目標的屬性,例如目標在螢幕上的位置,運動的時間長

JAVAWEB學習筆記網上商城實戰4:訂單模塊

接收 筆記 網上商城 詳情 src head 分頁查詢 cnblogs logs 今日任務 完成訂單模塊的功能 1.1 訂單 模塊的功能 1.1.1 我的訂單: 【我的訂單的查詢】 * 在header.jsp中點擊我的訂單. * 提交到Servlet:

extjs6學習筆記0.1 準備:基礎概念(02)

json over cal 類的屬性 tab 常用事件 data 微軟 基於 Ext 類 Ext 是一個全局單例的對象,在 Sencha library 中它封裝了所有的類和許多實用的方法。許多常用的函數都定義在 Ext 對象裏。它還提供了像其他類中一些頻繁使用的方法

Linux學習筆記第8章 Linux shell基礎知識

linux centos shell 通配 8.1shell介紹shell是一個命令解釋器,提供人機交互。支持特定語法。每個用戶都可以有自己特定的shell(bash)。CentOS7默認bash(Bourne Agin Shell)。其他還有zsh、ksh等。 8.2命令歷史命令歷史存放於

爬蟲學習筆記網絡協議及請求基礎

adding 數據 one con 響應狀態 基礎 referer html tran http協議與https協議 HTTP協議(全稱為HyperText Transfer Protocol,超文本傳輸協議),是發布和接收HTML頁面的方法,其服務端口號為80。 HTTP

學習筆記:計算幾何基礎4 Geometric Intersection

找到 篩選 檢查 結果 凸包 gap 直線 新的 ole Ahead 10.6.2018 新的章節,從凸包到幾何求交 定義 在一組幾何物體中找到公共部分 問題主要分4類 判斷問題(Determine) 即判定是否有交 計數問題(Count) 計算有多少交點 枚舉問題(En

jwt學習筆記--理論入門

概要 JWT是一種用於雙方之間傳遞安全資訊的簡潔的、URL安全的表述性宣告規範。JWT定義了一種簡潔的,自包含的方法用於通訊雙方之間以Json物件的形式安全的傳遞資訊。因為數字簽名的存在,這些資訊是可信的,JWT可以使用HMAC演算法或者是RSA的公私祕鑰對進行簽名。 簡潔(Comp

python學習筆記35:爬蟲基礎和相關產品API(和風天氣)使用例項

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。 在網站URL後面跟robots.txt一般就可以看到網站允許和禁止爬取的資源。 GET請求獲取響應內容 最基本的爬蟲。 import requests ''' 中國旅遊網 /www.cntour.

webpack學習筆記a01-基礎構建

webpack基於nodejs環境執行,首先確認已經安裝了node.js. 基礎構建流程 新建一個資料夾,這個就是你專案的根目錄。 在命令列中使用npm init命令初始化npm,會得到一個 ==package.json== 的檔案。 在命令列中安裝webpack和webpack-cli:

ML學習筆記3:機器學習中的數學基礎3(特徵值,特徵向量,認識SVD)

矩陣乘以向量的幾何意義 實際上也就是 所以,它還可以寫成 那麼把原來的矩陣按照列檢視來看,也就是 而[x]和[y]作為1x1的矩陣,在剛剛那個式子裡可以看成一個標量,也就變成了 所以矩陣乘以一個列向量,可以看成把這個列向量的每一個分

ML學習筆記5:機器學習中的數學基礎5(張量,哈達瑪積,生成子空間,超平面,範數)

向量/矩陣/張量 向量 向量可以表示成一維陣列,每個分量可以理解為向量所表示的點在空間中座標的分量。 矩陣 矩陣可以表示成二維陣列,上節理解了矩陣可以理解為線性對映在特定基下的一種定量描述。 張量 張量可以表示成任意維的陣列,張量是向量概

1.springboot學習筆記-基礎概念

一、為什麼使用springboot? springboot的配置少 專案可以快速搭建 內嵌Servlet容器,降低了對環境的要求,可以使用命令直接執行專案,應用可用jar包執行:java -jar; (以前的打包方式:打包成一個war包放入到tomcat/webapps

Hadoop學習筆記——Hadoop基礎

大資料時代 當前時代是資料爆炸的時代,全球各個網站、電子裝置等都在源源不斷地產生著大量資料.2006年數字世界專案統計得出全球資料總量為0.18ZB,2011年全球資料量1.8

JAVAWEB學習筆記12_Http&Tomcat

請求重定向 san res tor tomcat啟動 zha rac pac b- 一、Http協議 1.什麽是Http協議 HTTP,超文本傳輸協議(HyperText Transfer Protocol)是互聯網上應用最為廣泛的 一種網絡協議。所有的WWW文

extjs6學習筆記1.1 初始:創建項目

workspace 學習 分享 pps cnblogs log -i 學習筆記 apps 創建工作空間 sencha generate workspace /path/to/workspace 使用sencha創建應用 sencha

extjs6學習筆記1.2 初始:MVC MVVM

控制 進行 nbsp 例如 ges 如果 image 初始 互動 模型 這表示數據層。該模型可以包含數據驗證和邏輯來保持數據。在 ext js 中, 大多數模型都與一個數據存儲一起使用。 視圖 這表示用戶界面。 是用戶在屏幕上看到的組