sklearn：使用GBDT選擇特徵

阿新 • • 發佈：2019-02-03

（1）如何在numpy陣列中選取若干列或者行？
>>>import numpy as np
>>>tmp_a = np.array([[1,1], [0.4, 4], [1., 0.9]])
>>>tmp_a
>>>tmp_a[[0,1],:]#選第0、1行
>>>tmp_a[np.array([True, False, True]),:]# 選第0、2行
>>>tmp_a[:,[0]]#選第0列
>>>tmp_a[:, np.array([True, False])]#選第0列

（2）訓練GBDT，選取特徵，選完之後可以用其他方法繼續進行訓練。

from sklearn.ensemble import GradientBoostingClassifier
gbdt = GradientBoostingClassifier(
    init=None,
    learning_rate=0.1,
    loss='deviance',
    max_depth=3,
    max_features=None,
    max_leaf_nodes=None,
    min_samples_leaf=1,
    min_samples_split=2,
    min_weight_fraction_leaf=0.0,
    n_estimators=100,
    random_state=None,
    subsample=1.0,
    verbose=0,
    warm_start=False)
print "fit start!"
gbdt.fit(X[499:], y[499:])
print "fit success!"


score = gbdt.feature_importances_
print gbdt.feature_importances_.shape

#選擇importance>0的特徵

X_new = X[:, gbdt.feature_importances_>0]
X_new.shape

注：X為資料特徵，y為標記的類別。用X[499：]，y[499:]對GBDT進行訓練。然後如果該特徵的gbdt.feature_importances_>0，則該特徵保留，否則，則把該特徵刪除，從而達到選取特徵的效果。

sklearn：使用GBDT選擇特徵

sklearn：使用GBDT選擇特徵

sklearn：使用樹集合進行特徵轉換

機器學習：sklearn模型指標和特徵貢獻度檢視

秋招總結問題一：為什麼需要特徵選擇？特徵選擇有哪些？

機器學習：sklearn演算法引數選擇--網格搜尋

機器學習入門講解：什麼是特徵和特徵選擇

【轉】十分鐘上手sklearn：特徵提取，常用模型，交叉驗證

十分鐘上手sklearn：特徵提取，常用模型，交叉驗證

Spark MLlib 特徵抽取、轉化和選擇 -- 特徵選取：卡方選擇器

分針網——IT教育：jquery選擇器的用法

分針網——每日分享： jquery選擇器的用法

爬蟲：Scrapy5 - 選擇器Selectors

JavaScript插件：快速選擇日期----jedate日歷插件

房上的貓：if選擇結構

Android零基礎入門第57節：日期選擇器DatePicker和時間選擇器TimePicker

Android零基礎入門第58節：數值選擇器NumberPicker

算法2 排序算法：直接選擇排序和堆排序

css備忘：id選擇器的權重>class選擇器的權重=屬性選擇器的權重>元素選擇器

DBA：多方式選擇MySQL數據庫

算法：2選擇排序

sklearn：使用GBDT選擇特徵

相關推薦