【ML】統計學習方法筆記

阿新 • • 發佈：2018-11-09

統計學習的基本假設是同類資料具有一定的統計規律性
特徵空間(featrure space)的每一維對應於一個特徵。有時假設輸入空間與特徵空間為相同空間，對他們不予區分。有時假設輸入空間與特徵空間為不同的空間，將例項從輸入空間對映到特徵空間。模型實際上都是定義在特徵空間上的。
期望風險是模型關於聯合分佈的期望損失，經驗風險是模型關於訓練樣本集的平均損失。大數定理，當樣本容量趨於無窮時，經驗風險趨於期望風險。
極大似然估計就是經驗風險最小化的例子。當模型是條件概率分佈，損失函式是對數損失函式時，經驗風險最小化就等價於極大似然估計。
1. 極大似然估計(MLE):模型已定引數未定，找出一組引數使得模型產生出觀測資料的概率最大。
結構風險最小化就是為了防止過擬合，等價於正則化。加上表示模型複雜度的正則化項或懲罰項。結構風險小需要經驗風險與模型複雜度同時小。
貝葉斯估計的最大後驗概率估計就是結構風險最小化的例子。當模型是條件概率分佈，損失函式是對數損失函式，模型複雜度由模型的先驗概率表示時，結構風險最小化就等價於最大後驗概率估計。
1. https://www.cnblogs.com/sylvanas2012/p/5058065.html
將學習方法對位置資料的預測能力稱為泛化能力。
從貝葉斯的角度看，正則化項對應於模型的先驗概率，可以假設複雜的模型有較大的先驗概率，簡單的模型有較小的先驗概率

。
模型選擇的兩種方法：正則化/交叉驗證。

【ML】統計學習方法筆記

S1 統計學習的基本假設是同類資料具有一定的統計規律性特徵空間(featrure space)的每一維對應於一個特徵。有時假設輸入空間與特徵空間為相同空間，對他們不予區分。有時假設輸入空間與特徵空間為不同的空間，將例項從輸入空間對映到特徵空間。模型實際上都是定義在特徵空間上的。

【InfluxDB】InfluxDB學習實踐筆記

日誌 class 例如 study search 用戶一個命令行書寫方式 InfluxDB是用Go編寫的一個開源分布式時序、事件和指標數據庫，無需外部依賴。它與Elasticsearch、Graphite等類似。比較適用於與事件緊密相關的數據，例如實時日誌數據、實

統計學習方法筆記9—EM演算法2

9.2 EM演算法的收斂性收斂定理9.1 觀測資料的似然函式單調遞增收斂定理9.2 EM演算法是收斂性包含對數似然函式序列的收斂性和關於引數估計序列的收斂性，即一定可以通過迭代發現似然函式的極值點。 9.3 EM演算法在高斯混合模型學習中的應用 9.3.1 高

李航—統計學習方法筆記（一）

什麼是獨立同分布？百度：在概率統計理論中，指隨機過程中，任何時刻的取值都為隨機變數，如果這些隨機變數服從同一分佈，並且互相獨立，那麼這些隨機變數是獨立同分布。如果隨機變數X1和X2獨立，是指X1的取值不影響X2的取值，X2的取值也不影響X1的取值且隨機變數X1和X2服從同一分佈，這意味著X1和X2具有

統計學習方法筆記1

第一章統計學習方法概論 1.1統計學習統計學習特點：計算機網路平臺，資料驅動，構建模型，預測分析統計學習物件：data，具有一定統計規律的資料統計學習目的：預測分析統計學習方法：模型，策略，演算法；統計學習方法的步驟：

統計學習方法筆記7.1

第七章支援向量機支援向量機（support vector machines,SVM)是一種二類分類模型，基本模型是定義在特徵空間上的間隔最大的線性分類器。 7.1 線性可分支援向量機與硬間隔最大化 7.1.1 線性可分支援向量機支援向量機的學習都是在特徵空

統計學習方法筆記（一）：K近鄰法的實現：kd樹

實現k近鄰演算法時，首要考慮的問題是如何對訓練資料進行快速的k近鄰搜尋。這點在特徵空間的維數大於訓練資料容量時尤為重要。構造kd樹 kd 樹是一種對k為空間中的例項點進行儲存的一邊對其進行快速檢索的樹形資料結構。kd樹是二叉樹，表示對k維空間的一個劃分（parti

李航·統計學習方法筆記·第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型

第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型標籤（空格分隔）：機器學習教程·李航統計學習方法邏輯斯蒂：logistic 李航書中稱之為：邏輯斯蒂迴歸模型周志華書中稱之為：對數機率迴歸模

《統計學習方法筆記》——Logistic迴歸

Logistic迴歸簡介假設有一些資料點，我們利用一條直線對這些資料點進行擬合（該線稱為最佳擬合直線），這個擬合過程就稱為迴歸。利用Logistic進行迴歸的主要思想：根據現有資料對分類邊界線建立迴歸公式，以此進行分類。演算法流程 1.優化目標函式

統計學習方法筆記二---感知機(Perceptron Learning Algorithm,PLA)

簡介感知機（perceptron）是二分類的線性分類模型，其輸入為例項的特徵向量，輸出為例項的類別，取+1和-1二值。感知機對應於輸入空間（特徵空間）中將例項劃分為正負兩類的分離超平面，屬於判別模型，解決的問題是分類問題。目標/目的：求出將訓練資料進行線

統計學習方法筆記（三）K近鄰演算法

K近鄰法（KNN）是一種基本的分類和迴歸的方法，KNN的基本思想是給出一定數量帶有標籤的訓練樣本，使用這些訓練樣本將特徵空間劃分成許多的子空間，當一個新的測試樣本進來以後，這個測試樣本一定會落在一個超矩形區域內部，然後找到距離這個測試樣本最近的K個訓練樣本，用這些訓練樣本的

統計學習方法筆記（三）統計學習方法簡介

正則化與交叉驗證前文所述的模型選擇只能大體選擇出一類較好的模型，即利用訓練資料集學習模型，沒有考慮到測試誤差，而正則化與交叉驗證的提出，則加入了測試誤差的考量，因此，這兩種方法用來選擇具體模型。正則化正則化是結構風險最小化策略的實現，其是在經驗風

統計學習方法筆記（一）統計學習方法簡介

統計學習概論：一、統計學習執行統計學習相關方法的前提：假設同類資料具有一定的統計規律性定義：計算機基於資料構建相應的概率統計模型，利用模型對資料進行預測與分析方法分類：監督學習、非監督

李航-統計學習方法筆記（一）：統計學習方法概論

對象統計學技術分享精確結束人的發生 abs 速度本系列筆記，主要是整理統計學習方法的知識點和代碼實現各個方法，來加強筆者對各個模型的理解，為今年找到好工作來打下基礎。計劃在一個月內更新完這本書的筆記，在此立一個flag: 從2019/2/17開始到 20

【統計學習方法-李航-筆記總結】十一、條件隨機場

本文是李航老師《統計學習方法》第十一章的筆記，歡迎大佬巨佬們交流。主要參考部落格: https://www.cnblogs.com/YongSun/p/4767734.html 主要內容： 1. 概率無向圖模型 2. 條件隨機場的定義與形式 3. 條件隨機

【統計學習方法-李航-筆記總結】十、隱馬爾可夫模型

本文是李航老師《統計學習方法》第十章的筆記，歡迎大佬巨佬們交流。主要參考部落格: https://www.cnblogs.com/YongSun/p/4767667.html https://www.cnblogs.com/naonaoling/p/5701634.html htt

【統計學習方法-李航-筆記總結】九、EM(Expectation Maximization期望極大演算法)演算法及其推廣

本文是李航老師《統計學習方法》第九章的筆記，歡迎大佬巨佬們交流。主要參考部落格: https://www.cnblogs.com/YongSun/p/4767517.html https://blog.csdn.net/u010626937/article/details/751160

【統計學習方法-李航-筆記總結】八、提升方法

本文是李航老師《統計學習方法》第八章的筆記，歡迎大佬巨佬們交流。主要參考部落格： https://www.cnblogs.com/YongSun/p/4767513.html 主要內容包括： 1. 提升方法AdaBoost演算法 2. AdaBoost演算法的訓練誤差分析

【統計學習方法-李航-筆記總結】七、支援向量機

本文是李航老師《統計學習方法》第七章的筆記，歡迎大佬巨佬們交流。主要參考部落格： https://www.cnblogs.com/YongSun/p/4767130.html https://blog.csdn.net/wjlucc/article/details/69376003

【統計學習方法-李航-筆記總結】六、邏輯斯諦迴歸和最大熵模型

本文是李航老師《統計學習方法》第六章的筆記，歡迎大佬巨佬們交流。主要參考部落格： http://www.cnblogs.com/YongSun/p/4767100.html https://blog.csdn.net/tina_ttl/article/details/53519391

【ML】統計學習方法筆記

相關推薦