scikit-learn：3. Model selection and evaluation

阿新 • • 發佈：2017-05-30

ews util tree ask efficient square esc alter 1.10

參考：http://scikit-learn.org/stable/model_selection.html

有待翻譯，敬請期待：

3.1. Cross-validation: evaluating estimator performance
翻譯文章參考：http://blog.csdn.net/mmc2015/article/details/47099275
- 3.1.1. Computing cross-validated metrics
  - 3.1.1.1. Obtaining predictions by cross-validation
- 3.1.2. Cross validation iterators
  - 3.1.2.1. K-fold
  - 3.1.2.2. Stratified k-fold
  - 3.1.2.3. Leave-One-Out - LOO
  - 3.1.2.4. Leave-P-Out - LPO
  - 3.1.2.5. Leave-One-Label-Out - LOLO
  - 3.1.2.6. Leave-P-Label-Out
  - 3.1.2.7. Random permutations cross-validation a.k.a. Shuffle & Split
  - 3.1.2.8. Predefined Fold-Splits / Validation-Sets
  - 3.1.2.9. See also
- 3.1.3. A note on shuffling
- 3.1.4. Cross validation and model selection
3.2. Grid Search: Searching for estimator parameters
翻譯文章參考：http://blog.csdn.net/mmc2015/article/details/47100091
- 3.2.1. Exhaustive Grid Search
- 3.2.2. Randomized Parameter Optimization
- 3.2.3. Tips for parameter search
  - 3.2.3.1. Specifying an objective metric
  - 3.2.3.2. Composite estimators and parameter spaces
  - 3.2.3.3. Model selection: development and evaluation
  - 3.2.3.4. Parallelism
  - 3.2.3.5. Robustness to failure
- 3.2.4. Alternatives to brute force parameter search
  - 3.2.4.1. Model specific cross-validation
    - 3.2.4.1.1. sklearn.linear_model.ElasticNetCV
    - 3.2.4.1.2. sklearn.linear_model.LarsCV
    - 3.2.4.1.3. sklearn.linear_model.LassoCV
      - 3.2.4.1.3.1. Examples using sklearn.linear_model.LassoCV
    - 3.2.4.1.4. sklearn.linear_model.LassoLarsCV
      - 3.2.4.1.4.1. Examples using sklearn.linear_model.LassoLarsCV
    - 3.2.4.1.5. sklearn.linear_model.LogisticRegressionCV
    - 3.2.4.1.6. sklearn.linear_model.MultiTaskElasticNetCV
    - 3.2.4.1.7. sklearn.linear_model.MultiTaskLassoCV
    - 3.2.4.1.8. sklearn.linear_model.OrthogonalMatchingPursuitCV
      - 3.2.4.1.8.1. Examples using sklearn.linear_model.OrthogonalMatchingPursuitCV
    - 3.2.4.1.9. sklearn.linear_model.RidgeCV
      - 3.2.4.1.9.1. Examples using sklearn.linear_model.RidgeCV
    - 3.2.4.1.10. sklearn.linear_model.RidgeClassifierCV
  - 3.2.4.2. Information Criterion
    - 3.2.4.2.1. sklearn.linear_model.LassoLarsIC
      - 3.2.4.2.1.1. Examples using sklearn.linear_model.LassoLarsIC
  - 3.2.4.3. Out of Bag Estimates
    - 3.2.4.3.1. sklearn.ensemble.RandomForestClassifier
      - 3.2.4.3.1.1. Examples using sklearn.ensemble.RandomForestClassifier
    - 3.2.4.3.2. sklearn.ensemble.RandomForestRegressor
      - 3.2.4.3.2.1. Examples using sklearn.ensemble.RandomForestRegressor
    - 3.2.4.3.3. sklearn.ensemble.ExtraTreesClassifier
      - 3.2.4.3.3.1. Examples using sklearn.ensemble.ExtraTreesClassifier
    - 3.2.4.3.4. sklearn.ensemble.ExtraTreesRegressor
      - 3.2.4.3.4.1. Examples using sklearn.ensemble.ExtraTreesRegressor
    - 3.2.4.3.5. sklearn.ensemble.GradientBoostingClassifier
      - 3.2.4.3.5.1. Examples using sklearn.ensemble.GradientBoostingClassifier
    - 3.2.4.3.6. sklearn.ensemble.GradientBoostingRegressor
      - 3.2.4.3.6.1. Examples using sklearn.ensemble.GradientBoostingRegressor
3.3. Model evaluation: quantifying the quality of predictions
翻譯文章參考：http://blog.csdn.net/mmc2015/article/details/47121611
- 3.3.1. The scoring parameter: defining model evaluation rules
  - 3.3.1.1. Common cases: predefined values
  - 3.3.1.2. Defining your scoring strategy from metric functions
  - 3.3.1.3. Implementing your own scoring object
- 3.3.2. Classification metrics
  - 3.3.2.1. From binary to multiclass and multilabel
  - 3.3.2.2. Accuracy score
  - 3.3.2.3. Confusion matrix
  - 3.3.2.4. Classification report
  - 3.3.2.5. Hamming loss
  - 3.3.2.6. Jaccard similarity coefficient score
  - 3.3.2.7. Precision, recall and F-measures
    - 3.3.2.7.1. Binary classification
    - 3.3.2.7.2. Multiclass and multilabel classification
  - 3.3.2.8. Hinge loss
  - 3.3.2.9. Log loss
  - 3.3.2.10. Matthews correlation coefficient
  - 3.3.2.11. Receiver operating characteristic (ROC)
  - 3.3.2.12. Zero one loss
- 3.3.3. Multilabel ranking metrics
  - 3.3.3.1. Coverage error
  - 3.3.3.2. Label ranking average precision
- 3.3.4. Regression metrics
  - 3.3.4.1. Explained variance score
  - 3.3.4.2. Mean absolute error
  - 3.3.4.3. Mean squared error
  - 3.3.4.4. Median absolute error
  - 3.3.4.5. R2 score, the coefficient of determination
- 3.3.5. Clustering metrics
- 3.3.6. Dummy estimators
3.4. Model persistence
翻譯文章參考：http://blog.csdn.net/mmc2015/article/details/47143539
- 3.4.1. Persistence example
- 3.4.2. Security & maintainability limitations
3.5. Validation curves: plotting scores to evaluate models
翻譯文章參考：http://blog.csdn.net/mmc2015/article/details/47144197
- 3.5.1. Validation curve
- 3.5.2. Learning curve

scikit-learn：3. Model selection and evaluation

ews util tree ask efficient square esc alter 1.10 參考：http://scikit-learn.org/stable/model_selection.html 有待翻譯，敬請期待： 3.1. Cross-val

scikit-learn：3.5. Validation curves: plotting scores to evaluate models

ror 例如最大的 dsm models 不能 utl ring 告訴參考：http://scikit-learn.org/stable/modules/learning_curve.html estimator‘s generalization error

Model selection and evaluation

查準率、查全率與F1 對於二分類問題，可將樣例根據其真實類別與學習器預測類別的組合劃分為真正例(true positive) :真的正樣本,本來就是正樣本假正例(false positive) :假的正樣本,其實是負樣本真反倒(true negative) :真

scikit-learn： isotonic regression（保序回歸，非常有意思，僅做知識點了解，但差點兒沒用到過）

reg 現象最小給定推薦替代 ble class net http://scikit-learn.org/stable/auto_examples/plot_isotonic_regression.html#example-plot-isotonic-regre

scikit-learn：4.2. Feature extraction（特征提取，不是特征選擇）

for port ould 詞匯 ret sim hide pla pip http://scikit-learn.org/stable/modules/feature_extraction.html 帶病在網吧裏。。。。。。寫。求支持。。。 1、首先澄

scikit-learn：4. 數據集預處理（clean數據、reduce降維、expand增維、generate特征提取）

ova trac ict mea res additive track oval mmc 本文參考：http://scikit-learn.org/stable/data_transforms.html 本篇主要講數據預處理，包含四部分：數據清洗、數據

ISLR第六章Linear Model Selection and Regularization

another 訓練數據 16px style strong not 效率找到使用本章主要介紹幾種可替代普通最小二乘擬合的其他一些方法。 Why might we want to use another fitting procedure instead of le

Scikit-learn：聚類clustering

不同聚類效果比較sklearn不同聚類示例比較A comparison of the clustering algorithms in scikit-learn不同聚類綜述Method nameParametersScalabilityUsecaseGeometry (met

scikit-learn：CountVectorizer提取詞頻

http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html#sklearn.feature_extraction.text.Coun

Scikit-learn：scikit-learn快速教程及例項

scikit-learn 教程導航簡介：使用scikit-learn進行機器學習機器學習：問題設定載入樣例資料集學習和預測模型持久化慣例統計學習教程統計學習：scikit-learn中的配置和estimator物件有監督學習：預測高維觀測物件模型選擇：選擇estima

規則化和模型選擇（Regularization and model selection）——機器學習：交叉驗證Cross validation

零問題提出在機器學習中的偏差與方差一文中提到了偏差與方差。那麼在多種預測模型，如線性迴歸(y=θTx)，多項式迴歸(y=θTx^(1~m))等，應使用那種模型才能達到偏差與方差的平衡最優？形式化定義：假設可選的模型集合是M={M1,M2,...,Md}，比如SVM，

【SciKit-Learn學習筆記】3：線性迴歸測算波士頓房價,Logistic迴歸預測乳腺癌

學習《scikit-learn機器學習》時的一些實踐。線性迴歸這部分和第一篇筆記"繪製隨機波動樣本的學習曲線 "部分基本類似。線性迴歸裡可以加入多項式特徵，以對模型做增強。線性迴歸增加多項式特徵,擬合sin函式 import numpy as np impor

ML：Scikit-Learn 學習筆記（3） --- Nearest Neighbors 最近鄰迴歸及相關演算法

1 最近鄰迴歸最近鄰迴歸是用在標籤值是連續取值的場景智商的，而不是離散取值，而是用最近鄰迴歸進行查詢的點，最後得到的結果是其所有最近鄰居的平均值。 scikit-learn 在迴歸部分，同樣實現了兩種迴歸演算法，和之前的一樣，和KNN思想近似的KNeigh

機器學習：SVM（scikit-learn 中的 RBF、RBF 中的超參數 γ）

import colors 機器 class 核函數 RoCE caf 情況方差一、高斯核函數、高斯函數 μ：期望值，均值，樣本平均數；（決定告訴函數中心軸的位置：x = μ） σ2：方差；（度量隨機樣本和平均值之間的偏離程度：，為總體方差，為變量，為總體

django啟動服務時報錯：RuntimeError: Model class index.models.User doesn't declare an explicit app_label and isn't in an application in INSTALLED_APPS.

error: 時報解決 install runtime .py 遇到 setting runt 在django框架中用命令啟動服務時報如下錯誤：　　RuntimeError: Model class index.models.User doesn‘t declare

scikit-learn：3. Model selection and evaluation

scikit-learn：3. Model selection and evaluation

scikit-learn：3.5. Validation curves: plotting scores to evaluate models

Model selection and evaluation

scikit-learn： isotonic regression（保序回歸，非常有意思，僅做知識點了解，但差點兒沒用到過）

scikit-learn：4.2. Feature extraction（特征提取，不是特征選擇）

scikit-learn：4. 數據集預處理（clean數據、reduce降維、expand增維、generate特征提取）

ISLR第六章Linear Model Selection and Regularization

Scikit-learn：聚類clustering

scikit-learn：CountVectorizer提取詞頻

Scikit-learn：scikit-learn快速教程及例項

規則化和模型選擇（Regularization and model selection）——機器學習：交叉驗證Cross validation

【SciKit-Learn學習筆記】3：線性迴歸測算波士頓房價,Logistic迴歸預測乳腺癌

ML：Scikit-Learn 學習筆記（3） --- Nearest Neighbors 最近鄰迴歸及相關演算法

機器學習：SVM（scikit-learn 中的 RBF、RBF 中的超參數 γ）

django啟動服務時報錯：RuntimeError: Model class index.models.User doesn't declare an explicit app_label and isn't in an application in INSTALLED_APPS.

OReilly.Hands-On.Machine.Learning.with.Scikit-Learn.and.TensorFlow學習筆記彙總

分享《機器學習實戰：基於Scikit-Learn和TensorFlow》高清中英文PDF+原始碼

分享《機器學習實戰：基於Scikit-Learn和TensorFlow》高清中英文PDF+源代碼

分享《機器學習實戰：基於Scikit-Learn和TensorFlow》+PDF+Aurelien

Hands-on Machine Learning with Scikit-Learn and TensorFlow（中文版）和深度學習原理與TensorFlow實踐-學習筆記

scikit-learn：3. Model selection and evaluation

相關推薦