1. 程式人生 > 其它 >卡方檢驗

卡方檢驗

參考:什麼是卡方檢驗

連續投擲硬幣50次,其中22次為正面,28次為方面,問這枚硬幣是否是正常硬幣?

這是個假設檢驗的問題。

若用卡方檢驗來做,需要先用上面的公式計算卡方值X2,然後查表看卡方值有沒有落入指定區間,即可判定是否應該接受假設。

類似的拋骰子的例子:拋36次,已知各個點數朝上的次數,問是否骰子均衡?

卡方檢驗在機器學習中可以用來篩選特徵,判斷某個特徵與標籤之間是否存在顯著關聯,相關性有多大等。例如,

>>> from sklearn.datasets import load_iris
>>> from sklearn.feature_selection import
SelectKBest >>> from sklearn.feature_selection import chi2 #匯入卡方檢驗工具 >>> iris = load_iris() >>> X, y = iris.data, iris.target >>> X.shape (150, 4) >>> X_new = SelectKBest(chi2, k=2).fit_transform(X, y) >>> X_new.shape (150, 2)