統計學習方法_李航_筆記

阿新 • • 發佈：2018-11-29

統計學習方法_李航

因本人剛開始寫部落格，學識經驗有限，如有不正之處望讀者指正，不勝感激；也望藉此平臺留下學習筆記以溫故而知新。這一篇文章介紹的是李航的統計學習方法一書的第一遍學習筆記。

統計學習方法概論

統計學習方法概論

統計學習的物件是資料，從資料出發，提取資料的特徵，抽象出資料的模型，發現數據中的知識，又回到對資料的分析與預測中去。

統計學習的目標是考慮學習什麼樣的模型和如何學習模型，以使模型能對資料進行準確的預測與分析，同時也要考慮儘可能地提高學習效率。

統計學習的組成：監督學習、非監督學習、半監督學習和強化學習等。

統計學習方法的三要素：模型、策略和演算法.

學習或選擇最優模型的預測錯誤的程度度量：通常採用損失函式或代價函式。

統計學習常用的損失函式：損失函式、平方損失函式、絕對損失函式、對數損失函式。

典型的生成模型：樸素貝葉斯法和隱馬爾可夫模型。

典型的判別模型：k近鄰法、感知機、決策樹、邏輯斯諦迴歸模型、最大熵模型、支援向量機、提升方法和條件隨機場等。

生成方法的特點：生成方法可以還原出聯合概率分佈P(X，Y)，而判別別方法則不能。生成方法的學習收斂速度更快，即當樣本容量增加的時候，學到的模型可以更快地收斂於真實模型；當存在隱變數時，仍可以用生成方法學習，此時判別方法就不能用。

判別方法的特點：判別方法直接學習的是條件概率 P(Y|X）或決策函式f(X），直接面對預測，往往學習的準確率更高；由於直接學習P(Y|X）或f(X），可以對資料進行各種程度上的抽象、定義特徵並使用特徵，因此可以簡化學習問題。

實現統計學習方法的步驟如下:
(1）得到一個有限的訓練資料集合；
(2）確定包含所有可能的模型的假設空間，即學習模型的集合；
(3）確定模型選擇的準則，即學習的策略；
(4）實現求解最優模型的演算法，即學習的演算法；
(5）通過學習方法選擇最優模型；
(6）利用學習的最優模型對新數掘進行預測或分析。

監督學習圖示：

感知機學習演算法

K近鄰

K近鄰模型由三個基本要素距離度量、k值的選擇和分類決策規則決定。

距離度量:

K近鄰法的實現：kd樹

構造kd樹

搜尋kd樹

樸素貝葉斯

決策樹

決策樹學習過程
• 特徵選擇
• 決策樹生成：遞迴結構，對應於模型的區域性最優
• 決策樹剪枝：縮小樹結構規模、緩解過擬合

ID3基於資訊增益作為屬性選擇的度量

C4.5基於資訊增益比作為屬性選擇的度量

邏輯迴歸模型

支援向量機

提升方法boosting

核心：多個弱分類器可以組成成為強分類器

EM演算法

求期望，再求最大值

隱馬爾可夫模型

參考文獻

統計學習方法李航

《統計學習方法》(李航)讀書筆記(完結)超級火爆的總結

閱讀目錄知識點感知機 k近鄰法樸素貝葉斯決策樹 logistic迴歸和最大熵模型支援向量機提升方法 EM演算法隱馬爾可夫模型(HMM) 統計學習方法總結神經網路 K-Means

統計學習方法（李航）筆記

感知機/k近鄰/貝葉斯/決策樹前言：有時候公式實在不好理解的時候可以看一道例題理解，或者執行程式debug除錯逐步看輸入輸出變化進行理解！第二章感知機感知機概念輸入到輸出空間的對映：f(x) =sign(w*x+b) sign函式如下：感知器是一種線性分類器模型，屬於

統計學習方法（李航）---筆記

第二章感知機感知機概念輸入到輸出空間的對映：f(x) =sign(w*x+b) sign函式如下：感知器是一種線性分類器模型，屬於判別模型。感知機是採用隨機梯度下降，是在所有誤分點中隨機選一個誤差點的梯度下降來跟新其的權重和偏執。感知機學習演算法原始

《統計學習方法》李航著第一章讀書筆記

有一個公眾號叫 “夕小瑤的賣萌屋” ，這位公眾號推薦說李航的《統計學習方法》是一門基礎課。因此我從網上找了找資源，著手去看了。覺得寫得確實很棒。首先，以前看機器學習理論總是單獨看，分著看，覺得關聯規則就是關聯規則，神經網路就是神經網路。但是這本書能讓我有著一種想法，就是將整個機

《統計學習方法（李航）》整合學習（內容有拓展）學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.自助法（Bootstrap） 1）自助法是一種有放回的抽樣方法。核心思想是從原樣本集有放回抽取N個子集，訓練N個分類器，進行整合。 2）Bagging和Boosting都是Bo

《統計學習方法（李航）》支援向量機學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）支援向量機（SVM）是一種二分類模型（1）它的基本模型定義在特徵空間上的間隔最大化的線性分類器，間隔最大使它有別於感知機（感知機的損失函式只判斷是否正確分類）。

《統計學習方法（李航）》邏輯斯蒂迴歸與最大熵模型學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）線性迴歸（1）是確定兩種或以上變數間相互依賴的定量關係的一種統計分析方法。（2）模型：y=wx+b （3）誤差函式：（4）常見求解方法最小

《統計學習方法（李航）》樸素貝葉斯學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）樸素貝葉斯（naive Bayes）法只能用於分類，先基於特徵條件獨立假設學習輸入/輸出的聯合概率分佈，然後對給定的輸入x，利用貝葉斯定理求出後驗概率最大的輸出y。 2

《統計學習方法（李航）》k近鄰學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）k近鄰是一種基本分類與迴歸方法，不具有顯式的學習過程。 2）模型由三個基本要素決定：距離度量、k值選擇和分類決策規則。 3）k近鄰法最簡單的實現方法是線性掃描，當

《統計學習方法（李航）》感知機學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）感知機是二分類的線性分類模型 2）經驗風險函式/損失函式, M為誤分類點 3）學習策略, M為誤分類點 4）感知機是誤分類驅動的，具體採用隨機梯度下降法求解。 5）感知機存在

《統計學習方法（李航）》統計學習方法概論學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）統計學三要素（1）模型：就是所要學習的條件概率分佈或決策函式（2）策略：從假設空間中選取最優模型，需要考慮按照什麼樣的準則學習或選擇最優的模型（

《統計學習方法》李航著——第一章學習筆記

第一章：熟悉統計學習方法的基本概念統計學習：基於資料構建概率統計模型並運用模型對資料進行預測和分析，也稱為統計機器學習。 1.統計學習組成：監督學習，半監督學習，非監督學習和強化學習。 2.統計學習三個基本要素：模型（假設空間）、策略（確定選擇模型的規則）、演算法（求解最

《統計學習方法（李航）》講義第04章樸素貝葉斯

ima .cn 效率常用 1-1 估計實現技術 com 樸素貝葉斯(naive Bayes) 法是基於貝葉斯定理與特征條件獨立假設的分類方法。對於給定的訓練數據集，首先基於特征條件獨立假設學習輸入/輸出的聯合概率分布；然後基於此模型，對給定的輸入x，利用貝

《統計學習方法（李航）》講義第05章決策樹

lan 定義 if-then 利用建立 then 統計來源根據決策樹(decision tree) 是一種基本的分類與回歸方法。本章主要討論用於分類的決策樹。決策樹模型呈樹形結構，在分類問題中，表示基於特征對實例進行分類的過程。它可以認為是if-then

統計學習方法　李航　決策樹

決策樹一.決策樹基本描述決策樹是一種基本的分類與迴歸方法,呈樹形結構,在分類問題中,表示基於特徵對例項進行分類的過程.學習時,利用訓練資料根據損失函式最小化的原則建立決策樹模型.預測時,對新的資料,利用決策樹模型進行分類.而學習又通常包括三個步驟:特徵選擇,決策樹生成,決策樹修剪. 二.決策樹模

《統計學習方法（李航）》決策樹學習方法

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）特徵選擇依據 ID3：資訊增益最大： C4.5：資訊增益比最大：，n為特徵A的取值個數，Di為特徵A第i個取值的集合 CART

《統計學習方法》——李航學習大綱

最近在學習李航寫的統計學習方法概論，每一章都用xmind理清了思路，括號裡是書裡的公式，第一次寫博文，敬請指教~~~~ 第一章統計學習方法論第二章感知機每個方法其實只需要著重掌握三要素和輸入輸出就可以了，主要看模型、策略和演算法。感知機主要是二類分類的線

統計學習方法　李航　支持向量機

所有 www 基本通過 btv lfs 說明地方目的實際上這裏從線性可分支持向量機到線性支持向量機再到非線性支持向量機，就是從特殊到一般的過程．這裏介紹了函數間隔和幾何間隔，這裏前面乘以y的目的就是為了保證得到的值為正；註意定義中是間隔還是間隔的

統計學習方法　李航　提升方法

博客不能不為 href sdn 發的 asn 思想求和很好理解，就是將一些基本的性能一般的弱分類器組合起來，來構成一個性能較好的強分類器；這其中如果數據一樣的話那不是每次訓練出的分類器就都一樣了嘛，所以在每次訓練後要根據訓練結果來改變數據的權重；還有一個關鍵點

統計學習方法_李航_筆記

統計學習方法_李航因本人剛開始寫部落格，學識經驗有限，如有不正之處望讀者指正，不勝感激；也望藉此平臺留下學習筆記以溫故而知新。這一篇文章介紹的是李航的統計學習方法一書的第一遍學習筆記。統計學習方法概論統計學習方法概論統計學習的物件是資