【Scikit-Learn 中文文件】二十四:協方差估計 / 經驗協方差 / 收斂協方差 / 稀疏逆協方差 / Robust 協方差估計
2.8.1. 基本收斂
儘管是協方差矩陣的無偏估計, 最大似然估計不是協方差矩陣的特徵值的一個很好的估計, 所以從反演得到的精度矩陣是不準確的。 有時,甚至出現數學原因,經驗協方差矩陣不能反轉。 為了避免這樣的反演問題,引入了經驗協方差矩陣的一種變換方式:shrinkage
。
在 scikit-learn 中,該變換(具有使用者定義的收縮係數) 可以直接應用於使用 shrunk_covariance
方法預先計算協方差。
此外,協方差的收縮估計可以用 ShrunkCovariance
物件
及其 ShrunkCovariance.fit
方法擬合到資料中。
再次,根據資料是否居中,結果會不同,所以可能要準確使用引數 assume_centered
。
在數學上,這種收縮在於減少經驗協方差矩陣的最小和最大特徵值之間的比率。 可以通過簡單地根據給定的偏移量移動每個特徵值來完成, 這相當於找到協方差矩陣的l2懲罰的最大似然估計器(l2-penalized Maximum Likelihood Estimator)。在實踐中,收縮歸結為簡單的凸變換: .
選擇收縮量, 相當於設定偏差/方差權衡,下面將討論。
相關推薦
【Scikit-Learn 中文文件】二十四:協方差估計 / 經驗協方差 / 收斂協方差 / 稀疏逆協方差 / Robust 協方差估計
2.8.1. 基本收斂 儘管是協方差矩陣的無偏估計, 最大似然估計不是協方差矩陣的特徵值的一個很好的估計, 所以從反演得到的精度矩陣是不準確的。 有時,甚至出現數學原因,經驗協方差矩陣不能反轉。 為了避免這樣的反演問題,引入了經驗協方差矩陣的一種變換方式:shrinkage 。 在 scikit-le
【Scikit-Learn 中文文件】線性和二次判別分析
1.2. 線性和二次判別分析 這些分類器十分具有魅力,因為他們可以很容易計算得到閉式解,其天生的多分類特性,在實踐中已經證明很有效,並且不需要再次調參。 以上這些影象展示了 Linear Discriminant Analysis (線性判別分析)以及 Quadratic Disc
【Scikit-Learn 中文文件】新異類和異常值檢測
2.11. 新異類和異常值檢測 許多應用需要能夠判斷新觀測是否屬於與現有觀測相同的分佈(它是一個非線性的),或者應該被認為是不同的(這是一個異常值)。 通常,這種能力用於清理實際的資料集。 必須做出兩個重要的區別: 新奇檢測: 訓練
【Scikit-Learn 中文文件】分解成分中的訊號(矩陣分解問題)
2.5.1.3. PCA 使用隨機SVD 通過丟棄具有較低奇異值的奇異向量成分,將資料降維到低維空間並保留大部分方差是非常有意義的。 例如,如果我們使用64x64畫素的灰度級影象進行人臉識別,資料的維數為4096, 在這樣大的資料上訓練含RBF核心的支援向量機是很慢的。 此外我們知道資料本
【Scikit-Learn 中文文件】神經網路模型(無監督)- 無監督學習
2.13.1.3. 隨機最大似然學習 在 BernoulliRBM 函式中實現的學習演算法被稱為隨機最大似然(Stochastic Maximum Likelihood (SML))或持續對比發散(Persistent Contrastive Divergence (PCD))。由於資料的似然函式的形
【Scikit-Learn 中文文件】處理文字資料
載入這20個新聞組的資料集 該資料集名為 “Twenty Newsgroups”. 下面就是這個資料集的介紹, 來源於 網站: 20 個新聞組資料集是一個近 包括了20,000 個新聞組檔案的彙編,(幾乎)平均分成了 20 個不同新聞組. 據我們所知,這最初是由 Ken Lang 收集的 ,很可能是為了
機器學習 Python scikit-learn 中文文件(7)模型選擇: 選擇合適的估計器及其引數
模型選擇: 選擇合適的估計器及其引數 與官方文件完美匹配的中文文件,請訪問 https://www.studyai.cn Score, 和 cross-validated scores 交叉驗證生成器 網格搜尋與交叉驗證估計器 網格搜尋 自帶交叉驗證的估計器 模型選擇: 選擇
機器學習 Python scikit-learn 中文文件(3)使用 scikit-learn 介紹機器學習
與官方文件完美匹配的中文文件,請訪問 https://www.studyai.cn 與官方文件完美匹配的中文文件,請訪問 https://www.studyai.cn Logo 首頁 安裝 文件 案例 Fork me on GitHub Previous scikit-learn
機器學習 Python scikit-learn 中文文件(2)教程目錄
與官方文件完美匹配的中文文件,請訪問 https://www.studyai.cn 與官方文件完美匹配的中文文件,請訪問 https://www.studyai.cn scikit-learn 教程 使用 scikit-learn 介紹機器學習 機器學習:問題設定 載入示例資
機器學習 Python scikit-learn 中文文件 (1)
與官方文件完美匹配的中文文件,請訪問 https://www.studyai.cn 與官方文件完美匹配的中文文件,請訪問 https://www.studyai.cn Logo 首頁 安裝 文件 案例 ‹› scikit-learn 在Python中進行機器學習 簡單且高效的
【軟體開發底層知識修煉】二十四 ABI之函式呼叫約定
上一篇文章學習了Linux環境下的函式棧幀的形成與摧毀。點選連結檢視相關文章:軟體開發底層知識修煉】二十三 ABI-應用程式二進位制介面三之深入理解函式棧幀的形成與摧毀 本篇文章繼續學習ABI介面相關的內容。函式呼叫約定
轉: 【Java並發編程】之十四:圖文講述同步的另一個重要功能:內存可見性
integer sdn 技術 訪問 span 另一個 edi int tro 轉載請註明出處:http://blog.csdn.net/ns_code/article/details/17288243 加鎖(synchronized同步)的功能不僅僅局限於互斥
python-ConfigParser模塊【讀寫配置文件】
target new start 需要 details string 如何 設置變量 board http://www.codesky.net/article/201003/122500.html http://www.linuxso.com/linuxbiancheng/
3月15日 【如何讀取配置文件】
http gpa cnblogs 報錯 其他 set 檢查 utf 寫入 3月15日 【如何讀取配置文件】 讀取配置總是報錯,後檢查環境變量 ,將庫文件考入即可無法導入 configparser模塊,import configparser報錯解. 在Python2下,需要
【pySerial3.4官方文件】6、示例
示例 Miniterm Miniterm現在可用作模組而不是示例。有關詳細資訊,請參閱serial.tools.miniterm。 miniterm.py miniterm計劃。 setup-miniterm-py2exe.py 這是Windows的py2exe安
【pySerial3.4官方文件】4、工具
工具 serial.tools.list_ports 可以執行此模組以獲取埠列表()。它還包含以下功能。python -m serial.tools.list_ports serial.tools.list_ports.comports(include_l
【pySerial3.4官方文件】3、pySerial API
pySerial API 類 本地埠 類serial.Serial __init__(port = None,baudrate = 9600,bytesize = EIGHTBITS,parity = PARITY_NONE,stopbits = STOPBITS_ONE
【pySerial3.4官方文件】2、簡介
簡介 開啟串列埠 開啟“9600,8,N,1”的埠,沒有超時: >>> import serial >>> ser = serial.Serial('/dev/ttyUSB0') # open serial port >>> pri
Xadmin中文文件(二)
Xadmin 快速入門指南 要使用Xadmin,需要安裝Django 1.4並且必須啟用管理站點。 注:由於Xadmin已經停止維護,使用Django2.0 以上版本會存在許多相容性問題 安裝 使用pip: pip install django-xadmin
【Maven官網文件】Optional & Exclusion Maven中的可選依賴和依賴性排除
本節介紹Maven中的可選依賴和依賴性排除功能。 【原文連結】 Optional 依賴 如果明確一個 project 無論出於什麼原因考慮都不可能繼續分割成子專案,則其依賴可以使用 optional。 如果其他 project 依賴了 使用 optional 的