經驗誤差、測試誤差、泛化誤差及其偏差-方差分解

阿新 • • 發佈：2022-04-12

目錄

引言
經驗誤差、測試誤差、泛化誤差定義
泛化誤差的偏差-方差分解
偏差-方差圖解
偏差-方差tradeoff
模型複雜度
bagging和boosting
解決偏差-方差問題
- 針對偏差：避免欠擬合
- 針對方差：避免過擬合

引言

在構建機器學習模型時，通常需要先採集資料，然後將資料分為訓練集、驗證集、測試集。訓練集用於訓練模型，驗證集（如果資料量比較少可以採用交叉驗證的方式）用於調整超引數，測試集則用於最後評估模型的效能。通常假設所有的樣本都是獨立同分布取樣的。

經驗誤差、測試誤差、泛化誤差定義

經驗誤差指模型在訓練集上的誤差，即訓練誤差
測試誤差指模型在測試集上的誤差
泛化誤差指模型在所有資料上的誤差（也有人說是在學習器沒見過的資料上的誤差），泛化誤差一般是求不出來的。因此，一般訓練集和測試集不交叉，以測試誤差來近似代替泛化誤差。

泛化誤差的偏差-方差分解

偏差-方差分解用於衡量學習演算法的泛化能力，將學習演算法的期望泛化誤差進行分解。
泛化誤差 = 偏差 + 方差 + 噪聲
噪聲表示在當前任務上任何學習演算法所能達到的期望泛化誤差的下界，噪聲的存在意味著當前學習任務有固有的任何學習演算法都無法解決的問題，即定下了上限。即噪聲刻畫學習問題本身的難度。
偏差刻畫模型本身的擬合能力，當模型欠擬合時，偏差較大，此時偏差主導了泛化誤差。Bias是所有可能的訓練資料集訓練出的所有模型輸出的平均值與真實模型的輸出值之間的差異。
方差表示使用同樣大小的不同訓練集訓練所導致的模型的效能變化，刻畫了資料擾動造成的影響。方差主導泛化誤差時說明模型過擬合了，需要正則化。

通常偏差和方差之間是矛盾的，需要做平衡。偏差-方差tradeoff可以讓我們更好地瞭解模型的複雜度，但實用價值比較有限，因為沒辦法真的算出來方差和偏差。

偏差-方差圖解

如圖靶心是完美預測結果，即噪聲所代表的任何學習演算法在當前任務上能達到的上界。每一個數據集點都是在相同規模的不同資料集上的預測結果。
當所有資料點都距離靶心很遠時偏差較大，資料點之間距離較大時偏差較大。
資料點之間距離小，但是整體距離靶心很遠，此時發生了欠擬合。資料點之間距離大，但是整體都環繞在靶心周圍時發生了過擬合。資料點相互之間距離大，且都距離靶心很遠，那這種解決簡直糟透了，說明模型嚴重無法擬合數據，像是隨即亂猜吧。

偏差-方差tradeoff

給定學習任務，控制學習演算法的訓練程度：
當訓練不足時，學習器擬合能力不夠強，泛化誤差很大。此時訓練資料的擾動不足以使得學習器發生顯著變化（畢竟都很差），此時偏差主導了泛化誤差。
隨著訓練程度的加深，學習器的擬合能力不斷加強，可以更敏銳地感知訓練資料的變化，訓練資料的擾動也會被學習器學習到，此時方差主導了泛化誤差。當某個訓練集本身的非全域性特徵被學習器學到了以後就將發生過擬合。

模型複雜度

通常來說模型複雜度越高，對訓練資料有更強的擬合能力，容易導致過擬合，方差過大。模型複雜度越低，則不能很好地擬合模型，容易導致欠擬合，因為目前演算法大部分都是資料驅動的，因此要根據資料的特點正確調整模型的複雜度。

bagging和boosting

bagging通過取樣生成多個不同的訓練子集，訓練生成多個分類器，然後對分類器求平均，目的是降低模型的方差。bagging和random類的並行演算法都是這種效果。
boosting則是迭代演算法，每一輪迭代對上一輪迭代難以解決的問題進行處理，隨迭代進行誤差越來越小，不斷降低模型的偏差。

解決偏差-方差問題

無法避免偏差與方差，只能減弱影響。

針對偏差：避免欠擬合

尋找更好更有代表性的特徵
用更多的特徵（增加模型複雜度）

針對方差：避免過擬合

增大資料集，減少資料擾動的影響
減少資料維度，降低模型複雜度
正則化方法
交叉驗證。K折交叉驗證中K越小方差越小，因為k小時每個子訓練集資料越多，就越難發生過擬合。意思是交叉驗證時分的子資料集越多偏差就越小，方差越大，此時是過擬合，原因是因為子資料集越多則每個資料集中資料量越少，可能導致相對而言模型複雜度越高。

經驗誤差、測試誤差、泛化誤差及其偏差-方差分解

目錄引言經驗誤差、測試誤差、泛化誤差定義泛化誤差的偏差-方差分解偏差-方差圖解

vue-cli3 配置開發環境、測試環境、線上環境

001、在package.json檔案中新增 \"scripts\": { \"serve\": \"vue-cli-service serve\", //呼叫開發api

面試官問：實際生產中如何快速的測試介面(開發環境、測試環境、生產環境)

1.背景在實際開發中測試程式碼時必不可少的環節，並且通常要測試開發環境、測試環境、預釋出環境、灰度測試、生產環境等

11-MySQL-索引的分類、測試索引、索引原則

技術標籤：MySQLmysql索引 MySQL -> 索引 -> 索引的分類、測試索引、索引原則

測試計劃、測試方案、測試報告

測試計劃：　　偏管理型的文件，主要是解決誰來做？做什麼？的問題　　一般包含：測試的目的和範圍、人員與職責、資源與安排、風險與其規避措施、測試的輸入輸出標準

【TPC-DS】測試指令碼存放目錄、測試流程、測試結果衡量指標的計算方式講解

測試指令碼資料載入測試的SQL語句存放目錄：tpcds-3.2.0/tools/tpcds.sql 查詢的99條SQL的存放目錄：/home/tpcds-tool/tpcds-3.2.0/query_templates（注：是99條SQL的介紹，裡面的引數要進行修改）

《機器學習》筆記第2章——模型評估與選擇：經驗誤差與過擬合、評估方法、效能度量、比較檢驗方法、偏差與方差

2.1 經驗誤差與過擬合錯誤率:E = a(錯誤數) / m(樣本數) 精度 = 1 - 錯誤率誤差：在訓練集上的誤差成為訓練誤差，在新樣本上的誤差成為泛化誤差

MSE（均方誤差）、RMSE （均方根誤差）、MAE （平均絕對誤差）

MSE（均方誤差）、RMSE （均方根誤差）、MAE （平均絕對誤差） 1、MSE（均方誤差）（Mean Square Error）

js小數位運算有誤差、運算錯誤、不準確問題

場景： js小數位相加，例如100.1+0.99，將會得到有誤查的結果，如圖，這是因為二進位制運算引起的，而在java等程式語言中對浮點數運算進行了內部處理，js卻缺失這一塊，所以需要進行處理

Keras在訓練期間視覺化訓練誤差和測試誤差例項

詳細的解釋，讀者自行開啟這個連結檢視，我這裡只把最重要的說下 fit() 方法會返回一個訓練期間歷史資料記錄物件，包含 training error,training accuracy,validation error,validation accuracy 欄位，如下列印

mysql慢查詢操作例項分析【開啟、測試、確認等】

本文例項講述了mysql慢查詢操作。分享給大家供大家參考，具體如下： mysql有些sql會執行很慢，有可能造成伺服器負載飆升

Python 實現訓練集、測試集隨機劃分

隨機從列表中取出元素： import random dataSet = [[0],[1],[2],[3],[4],[5],[6],[7],[8],[9],[10]]

Visual Studio 2019安裝、測試建立c語言專案(圖文教程)

一、安裝 Visual Studio 2019是完全免費的，而且安裝比較簡單，不過還是想寫一寫，老規矩，先上下載地址

webpack正式、測試環境介面地址本地執行及打包命令配置

宣告：本文由w3h5原創，轉載請註明出處：《webpack正式、測試環境介面地址本地執行及打包命令配置》https://www.w3h5.com/post/521.html

我們為什麼要進行效能測試？（從需求和概念、測試指標系統分析為什麼做，做什麼，為什麼做）

評估系統的能力。當應用上線有大量使用者當問的時候，頁面的開啟速度直接影響使用者體驗，進而影響使用者的留存。瞭解使用者的真實使用體驗，對應用做出針對性的效能評估，有效提升使用者體驗。

5_面向物件-中之單元測試方法、包裝類的使用

單元測試方法 * Java中的JUnit單元測試　　*　　* 步驟：　　* 1.中當前工程 - 右鍵擇：build path - add libraries - JUnit 4 - 下一步　　* 2.建立Java類，進行單元測試。　　*此時的Java類要求：① 此類是pu

pytest「conftest、pytest引數化、重執行、出測試報告」

文章總覽圖一、conftest問題整理： 1.這個conftest.py分路徑嗎？如果在TestCases下建這個包可以直接用嗎？

oracle備份之備份測試指令碼的方法（冷備、熱備、rman)

1、資料庫環境資料庫DBID及開啟模式 SQL> select dbid,open_mode from v$database; DBID OPEN_MODE

C++11中std::move、std::forward、左右值引用、移動建構函式的測試問題

關於C++11新特性之std::move、std::forward、左右值引用網上資料已經很多了，我主要針對測試效能做一個測試，梳理一下這些邏輯，首先，左值比較熟悉，右值就是臨時變數，意味著使用一次就不會再被使用了。針對這兩種

python測試http、websocket介面

測試環境有個專案需要每天構造資料，來儘量保證測試環境和生產環境資料量保持一致。需要生成訂單後商家接單完成，以下是程式碼，主要是用介面完成