機器學習:緒論
阿新 • • 發佈:2017-06-26
訓練 ner special dict ttr 空間 attr cti 輸出
學習教材為周誌華教授的西瓜書《機器學習》
1.2 基本術語
維數 dimensionality
示例 instance
屬性或特征 attribute or feature
特征向量 feature space
預測 prediction
標記 label 好瓜
樣例 example 具有標記信息的示例
標記空間或輸出空間 label space 所有標記的集合
分類classifaction 預測的是離散值(好瓜 壞瓜)的學習任務
回歸regression 預測的時連續值(成熟度0.5 0.75)的學習任務
只涉及兩個類別的“二分類”(binary classification)任務,其中一個類為“正類”(positive class),另一個為“反類”(negative class)
涉及多個類別的“多分類”(multi-class classification)任務
聚類(clustering)將訓練集中的西瓜分成若幹組,每組為一個簇(cluster)
根據訓練數據是否擁有標記信息,學習任務可大致分為兩類:“監督學習”(supervised learning)和“非監督學習”(unsupervised learning)。分類和回歸是前者代表,聚類是後者代表。
獨立同分布(independent and identically distribution,簡稱i.i.d)
1.3 假設空間
歸納(induction)和演繹(deduction)是科學推理的兩大基本手段。
泛化(generalization)和特化(specialization)
假設(hypothesis)
假設空間和版本空間(version space)
機器學習:緒論