統計學習方法筆記1

阿新 • • 發佈：2018-12-11

第一章統計學習方法概論

1.1統計學習

統計學習特點：計算機網路平臺，資料驅動，構建模型，預測分析
統計學習物件：data，具有一定統計規律的資料
統計學習目的：預測分析
統計學習方法：模型，策略，演算法；統計學習方法的步驟：
統計學習方法的研究：理論與應用
統計學習方法重要性：資料探勘領域核心技術

1.2監督學習

1.2.1基本概念

輸入空間，輸出空間，特徵空間例項的特徵向量表示: 特徵空間：表示例項的特徵向量的集合訓練集的表示：
聯合概率分佈輸入與輸出的隨機變數X和Y遵循聯合概率分佈P（X,Y），P（X,Y）表示分佈函式。
假設空間輸入空間到輸出空間的模型集合，就是假設空間。監督學習的模型分非概率模型（決策函式Y=F(X)）和概率模型(條件概率表示)

1.2.2問題形式化

監督學習問題：在這裡插入圖片描述

1.3統計學習三要素（模型，策略，演算法）

1.3.1模型

模型：由輸入到輸出的一個函式，所有模型（函式）構成假設空間。模型分類：由決策函式表示的模型稱為非概率模型；由條件概率表示的模型稱為概率模型。非概率模型：在這裡插入圖片描述

概率模型：在這裡插入圖片描述

1.3.2策略（如何從假設空間選擇最優模型）

策略即衡量模型好壞的一個度量標準。

損失函式與風險函式損失函式:利用模型進行預測的輸出值f（X）與真實值Y的度量函式，記為L(Y,f(X))。統計學習中常用的損失函式：風險函式（期望損失）:平均意義下的損失，即損失函式的期望值。模型選擇即策略就是選擇期望風險最小的模型。

經驗風險最小化與結構風險最小化經驗風險：當具體到某一訓練集上時，風險函式就變為經驗風險，經驗風險是關於訓練樣本集的平均損失。根據大數定律可以知道，當樣本足夠大時，經驗風險就是風險函式。經驗風險最小化策略：最優模型即經驗風險最小時的模型。當樣本容量過小時存在問題：過擬合現象—結構風險最小化結構風險最小化：在經驗風險上加上表示模型複雜度的正則化項（罰項）結構風險定義為：尾項表示模型複雜度，模型越複雜，結構風險越大，反之，模型越簡單，結構風險越小。即可以有效防止過擬合問題。

1.3.3演算法

在這裡插入圖片描述

1.4模型評估與模型選擇

1.4.1訓練誤差與測試誤差

訓練誤差：關於訓練資料集在這裡插入圖片描述測試誤差：關於測試資料集

1.4.2 過擬合與模型選擇

過擬合現象：對於訓練資料預測能力極高的高複雜度的模型，這類模型過於追求對於訓練資料的擬合程度，訓練誤差極低，但導致模型引數過多，複雜度太高，而且對於未知資料的預測能力低，測試誤差太大。如何衡量模型複雜度與測試誤差及訓練誤差的關係？在這裡插入圖片描述

1.5正則化與交叉驗證

1.5.1正則化

正則化：結構風險最小化策略的實現，為了選擇經驗風險與模型複雜度同時較小的模型。正則化項：模型複雜度的單調遞增函式，模型複雜度越高，正則化值越大。正則化項不同形式：（範數？）在這裡插入圖片描述

1.5.2交叉驗證

資料集分為訓練集，驗證集，測試集，利用三個集合對模型進行來回驗證，即交叉驗證。分類：簡單交叉驗證；S折交叉驗證；留一交叉驗證

1.6泛化能力

1.6.1 泛化誤差

泛化誤差即模型的期望風險。在這裡插入圖片描述

1.6.2泛化誤差上界

泛化誤差上界性質：與樣本容量成反比，與假設空間容量成正比。二分類的泛化誤差上界：在這裡插入圖片描述

1.7生成模型與判別模型

生成模型：在這裡插入圖片描述判別模型：優缺點：

1.8 三大監督學習問題

分類問題分類問題中的模型稱為分類器，評價分類器效能的指標有以下：
標註問題經典應用：詞性標註問題常用統計學習方法：隱馬爾科夫模型，條件隨機場
迴歸問題

統計學習方法筆記1

第一章統計學習方法概論 1.1統計學習統計學習特點：計算機網路平臺，資料驅動，構建模型，預測分析統計學習物件：data，具有一定統計規律的資料統計學習目的：預測分析統計學習方法：模型，策略，演算法；統計學習方法的步驟：

統計學習方法筆記7.1

第七章支援向量機支援向量機（support vector machines,SVM)是一種二類分類模型，基本模型是定義在特徵空間上的間隔最大的線性分類器。 7.1 線性可分支援向量機與硬間隔最大化 7.1.1 線性可分支援向量機支援向量機的學習都是在特徵空

李航·統計學習方法筆記·第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型

第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型標籤（空格分隔）：機器學習教程·李航統計學習方法邏輯斯蒂：logistic 李航書中稱之為：邏輯斯蒂迴歸模型周志華書中稱之為：對數機率迴歸模

統計學習方法筆記9—EM演算法2

9.2 EM演算法的收斂性收斂定理9.1 觀測資料的似然函式單調遞增收斂定理9.2 EM演算法是收斂性包含對數似然函式序列的收斂性和關於引數估計序列的收斂性，即一定可以通過迭代發現似然函式的極值點。 9.3 EM演算法在高斯混合模型學習中的應用 9.3.1 高

【ML】統計學習方法筆記

S1 統計學習的基本假設是同類資料具有一定的統計規律性特徵空間(featrure space)的每一維對應於一個特徵。有時假設輸入空間與特徵空間為相同空間，對他們不予區分。有時假設輸入空間與特徵空間為不同的空間，將例項從輸入空間對映到特徵空間。模型實際上都是定義在特徵空間上的。

李航—統計學習方法筆記（一）

什麼是獨立同分布？百度：在概率統計理論中，指隨機過程中，任何時刻的取值都為隨機變數，如果這些隨機變數服從同一分佈，並且互相獨立，那麼這些隨機變數是獨立同分布。如果隨機變數X1和X2獨立，是指X1的取值不影響X2的取值，X2的取值也不影響X1的取值且隨機變數X1和X2服從同一分佈，這意味著X1和X2具有

統計學習方法筆記（一）：K近鄰法的實現：kd樹

實現k近鄰演算法時，首要考慮的問題是如何對訓練資料進行快速的k近鄰搜尋。這點在特徵空間的維數大於訓練資料容量時尤為重要。構造kd樹 kd 樹是一種對k為空間中的例項點進行儲存的一邊對其進行快速檢索的樹形資料結構。kd樹是二叉樹，表示對k維空間的一個劃分（parti

《統計學習方法筆記》——Logistic迴歸

Logistic迴歸簡介假設有一些資料點，我們利用一條直線對這些資料點進行擬合（該線稱為最佳擬合直線），這個擬合過程就稱為迴歸。利用Logistic進行迴歸的主要思想：根據現有資料對分類邊界線建立迴歸公式，以此進行分類。演算法流程 1.優化目標函式

統計學習方法筆記二---感知機(Perceptron Learning Algorithm,PLA)

簡介感知機（perceptron）是二分類的線性分類模型，其輸入為例項的特徵向量，輸出為例項的類別，取+1和-1二值。感知機對應於輸入空間（特徵空間）中將例項劃分為正負兩類的分離超平面，屬於判別模型，解決的問題是分類問題。目標/目的：求出將訓練資料進行線

統計學習方法筆記（三）K近鄰演算法

K近鄰法（KNN）是一種基本的分類和迴歸的方法，KNN的基本思想是給出一定數量帶有標籤的訓練樣本，使用這些訓練樣本將特徵空間劃分成許多的子空間，當一個新的測試樣本進來以後，這個測試樣本一定會落在一個超矩形區域內部，然後找到距離這個測試樣本最近的K個訓練樣本，用這些訓練樣本的

《統計學習方法》1——邏輯斯蒂迴歸

1. 模型二項邏輯斯蒂迴歸模型是由邏輯斯蒂分佈的條件概率分佈表示的分類模型。邏輯斯蒂分佈函式為其中，u是位置引數，是中心點（對稱點）的位置；r是形狀函式。其分佈圖形是一條S形曲線，也就是sigmoid曲線,S形曲線的範圍是(0,1)。

統計學習方法筆記（三）統計學習方法簡介

正則化與交叉驗證前文所述的模型選擇只能大體選擇出一類較好的模型，即利用訓練資料集學習模型，沒有考慮到測試誤差，而正則化與交叉驗證的提出，則加入了測試誤差的考量，因此，這兩種方法用來選擇具體模型。正則化正則化是結構風險最小化策略的實現，其是在經驗風

統計學習方法筆記（一）統計學習方法簡介

統計學習概論：一、統計學習執行統計學習相關方法的前提：假設同類資料具有一定的統計規律性定義：計算機基於資料構建相應的概率統計模型，利用模型對資料進行預測與分析方法分類：監督學習、非監督

李航-統計學習方法筆記（一）：統計學習方法概論

對象統計學技術分享精確結束人的發生 abs 速度本系列筆記，主要是整理統計學習方法的知識點和代碼實現各個方法，來加強筆者對各個模型的理解，為今年找到好工作來打下基礎。計劃在一個月內更新完這本書的筆記，在此立一個flag: 從2019/2/17開始到 20

[筆記]統計學習方法-1概論

書：李航老師的《統計學習方法》。 1.1 統計學習統計學習(statistical learning)的方法：基於資料構建統計模型從而對資料進行預測與分析。統計學習包括：supervised learning, unsupervised learning, semi-supervised learn

【統計學習方法讀書筆記】感知機的個人理解（1）

寫在前面：在友人的推薦下，開始入李航老師的坑，《統計學習方法》。讀到第二章，感知機，李航老師由淺入深讓我有了很好的理解，現在自己總結一下思路。正文：感知機用於二分類問題，由淺開始：假定我們有一個平面上存在許許多多的藍色點和紅色點，並且假設存在一條直線可以將藍紅

統計學習筆記（1）——統計學習方法概論

經驗風險較小的模型可能較複雜，這時正則化項的值會較大，正則化的作用是選擇經驗風險與模型複雜度同時較小的模型。正則化符合奧卡姆剃刀原理，在所有可能的模型中，能夠很好的解釋已知資料並且十分簡單的模型才是最好的模型。從貝葉斯估計的角度來看，正則化項對應於模型的先驗概率，可以假設複雜的模型有較小的先

第1章統計學習方法概論

通過統計執行算法標註概率分布過程改進非監督學習連續學習定義：如果一個系統能夠通過執行某個過程改進他的性能，這就是學習。統計學習的對象：數據目的：對數據進行預測和分析方法：監督學習、非監督學習、半監督學習、強化學習統計學習的三要素：方法 = 模

統計學習方法——學習筆記之概論

單調遞增可能性能 gist 子集數據速度計算機模型選擇原文地址（http://liuao.tech/post/20180612/） 1.統計學習赫爾伯特·西蒙曾對學習給出以下定義：如果一個系統能夠通過執行某個過程改進它的性能，這就是學習。

《統計學習方法》筆記一統計學習方法概論

類模型小時 term jsb lamda 計算方法直接估計預測統計學習統計學習時關於計算機基於數據構建概率統計模型並運用模型對數據進行預測與分析。統計學習的三要素：方法 = 模型+策略+算法統計學習由監督學習、非監督學習、半監督學習和強化學習等

統計學習方法筆記1

第一章統計學習方法概論

1.1統計學習

1.2監督學習

1.2.1基本概念

1.2.2問題形式化

1.3統計學習三要素（模型，策略，演算法）

1.3.1模型

1.3.2策略（如何從假設空間選擇最優模型）

1.3.3演算法

1.4模型評估與模型選擇

1.4.1訓練誤差與測試誤差

1.4.2 過擬合與模型選擇

1.5正則化與交叉驗證

1.5.1正則化

1.5.2交叉驗證

1.6泛化能力

1.6.1 泛化誤差

1.6.2泛化誤差上界

1.7生成模型與判別模型

1.8 三大監督學習問題

相關推薦