Python scikit-learn 做線性迴歸
阿新 • • 發佈:2022-04-29
線性迴歸是簡單易用的機器學習演算法,scikit-learn是python強大的機器學習庫。
本篇文章利用線性迴歸演算法預測波士頓的房價。波士頓房價資料集包含波士頓郊區住房價值的資訊。
第一步:Python庫匯入
%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport sklearn
第二步:資料獲取和理解
波士頓資料集是scikit-learn的內建資料集,可以直接拿來使用。
from sklearn.datasets import load_bostonboston = load_boston()
print(boston.keys())
dict_keys([‘data’, ‘target’, ‘feature_names’, ‘DESCR’])
print(boston.data.shape)
(506, 13)
print(boston.feature_names)
[‘CRIM’ ‘ZN’ ‘INDUS’ ‘CHAS’ ‘NOX’ ‘RM’ ‘AGE’ ‘DIS’ ‘RAD’ ‘TAX’ ‘PTRATIO’’B’ ‘LSTAT’]
結論:波士頓資料集506個樣本,14個特徵。
print(boston.DESCR)
bos = pd.DataFrame(boston.data)print(bos.head())
0 1 2 3 4 5 6 7 8 9 10