1. 程式人生 > >《機器學習(周志華)》Chapter1 緒論 課後習題答案

《機器學習(周志華)》Chapter1 緒論 課後習題答案



表1.1 包含4個樣例,3種屬性,假設空間中有3 * 4 * 4 + 1 = 49種假設。在不考慮冗餘的情況下,最多包含k個合取式來表達假設空間,顯然k的最大值是49,每次從中選出k個來組成析合式,共種可能。但是其中包含了很多沉餘的情況(至少存在一個合取式被剩餘的析合式完全包含<空集除外>)。

如果考慮沉餘的情況 在這裡忽略空集,一個原因是並不是太明白空集是否應該加入析合式,另外就算需要加入,求出了前面48種假設的組合,可以很容易求出加入空集後的組合數(每種可能都可以加上空集,再加上1種空集單獨的情況)。 48種假設中: 具體假設:2∗3∗3=18種 一個屬性泛化假設:2∗3+3∗3+2∗3=21種

兩個屬性泛化假設:2+3+3=8種 三屬性泛化:1種


回答1:
1). 通常認為兩個資料的屬性越相近,則更傾向於將他們分為同一類。若相同屬性出現了兩種不同的分類,則認為它屬於與他最臨近幾個資料的屬性。
2). 也可以考慮同時去掉所有具有相同屬性而不同分類的資料,留下的資料就是沒誤差的資料,但是可能會丟失部分資訊。
回答2:
1). 定義一個閾值,只要訓練後滿足的樣本數量百分比達到這個閾值即可。
2). 在訓練過程中選擇滿足最多樣本的假設。


NFL首先要保證真目標函式f均勻分佈。對於X個訓練資料的二分類問題,顯然f共有種情況,其中一半是與假設一致的,也就是P(f(x) = h(x)) = 0.5.因此,其中應為常數,如果效能度量為錯誤率,二者各為0.5,則該值為1,如果為其他效能度量,根據網友的想法:,應當隱含這樣的充分條件。


https://wenku.baidu.com/view/fd90c73f4b35eefdc8d3335e.html