1. 程式人生 > >機器學習:緒論

機器學習:緒論

訓練 ner special dict ttr 空間 attr cti 輸出

學習教材為周誌華教授的西瓜書《機器學習》

1.2 基本術語

維數 dimensionality

示例 instance

屬性或特征 attribute or feature

特征向量 feature space

預測 prediction

標記 label 好瓜

樣例 example 具有標記信息的示例

標記空間或輸出空間 label space 所有標記的集合

分類classifaction 預測的是離散值(好瓜 壞瓜)的學習任務

回歸regression 預測的時連續值(成熟度0.5 0.75)的學習任務

只涉及兩個類別的“二分類”(binary classification)任務,其中一個類為“正類”(positive class),另一個為“反類”(negative class)

涉及多個類別的“多分類”(multi-class classification)任務

聚類(clustering)將訓練集中的西瓜分成若幹組,每組為一個簇(cluster)

根據訓練數據是否擁有標記信息,學習任務可大致分為兩類:“監督學習”(supervised learning)和“非監督學習”(unsupervised learning)。分類和回歸是前者代表,聚類是後者代表。

獨立同分布(independent and identically distribution,簡稱i.i.d)

1.3 假設空間

歸納(induction)和演繹(deduction)是科學推理的兩大基本手段。

泛化(generalization)和特化(specialization)

假設(hypothesis)

假設空間和版本空間(version space)

機器學習:緒論