1. 程式人生 > >人工智慧之機器學習與深度學習-13

人工智慧之機器學習與深度學習-13

特徵提取與選擇

特徵

•特徵:反映資料分佈特點的關鍵資訊。

•資料和特徵決定了機器學習的上限,而模型和演算法只是逼近這個上限而已。

•特徵提取和特徵選擇都是從原始特徵中找出最有效的特徵。

•同類樣本的不變性

•不同樣本的鑑別性

•對噪聲的魯棒性

 

特徵提取與特徵選擇

•特徵抽取:將原始特徵轉換為一組具有明顯物理意義、統計意義或核的特徵,特徵抽取後的新特徵是原來特徵的一個對映。

•特徵選擇:從特徵集合中挑選一組最具統計意義的特徵,達到降維的目的。特徵選擇後的特徵是原來特徵的一個子集。

人工智慧之機器學習與深度學習-13
特徵選擇或提取的作用

•減少資料儲存和輸入資料頻寬

•消除噪聲帶來的影響

•避免高維度帶來的計算困難

•能發現更有意義的潛在的變數

•特徵之間是否可以比較?

•特徵的描述是否符合事實?

•特徵是否變得更少、更有利於分類?