機器學習(周志華)課後習題一:緒論
阿新 • • 發佈:2019-02-15
1 表1.1中若只包含編號為1和4的兩個樣例,試給出相應的版本空間
編號 | 色澤 | 根蒂 | 敲聲 | 好瓜 |
---|---|---|---|---|
1 | 青綠 | 蜷縮 | 濁響 | 是 |
4 | 烏黑 | 稍蜷 | 沉悶 | 否 |
根據表格可看出,每個屬性有兩個選項,而且加上萬用字元“*”,即每個屬性有3個選項,再加上3個屬性全是萬用字元的情況。因此假設空間總共有3*3*3+1=28種情況。而這28種情況中,好瓜的版本空間是(一般版本空間指正例泛化):
色澤 | 根蒂 | 敲聲 |
---|---|---|
青綠 | 蜷縮 | 濁響 |
青綠 | 蜷縮 | * |
青綠 | * | 濁響 |
* | 蜷縮 | 濁響 |
青綠 | * | * |
* | 蜷縮 | * |
* | * | 濁響 |
2 估算多少種可能的假設
3 設計一種歸納偏好用於假設選擇
首先由題可得,假設空間中有可能存在與所有訓練樣本都不一致的假設,即“屬性都一致,但label不一致”。就比如1中的“青綠^蜷縮^濁響”在訓練樣本中是好瓜(label),但是在實際假設中卻存在壞瓜的情況。這種時候,可以有以下幾種做法。
- 認為都是好瓜
- 認為都是壞瓜
- 將這一組資料(“青綠^蜷縮^濁響”)去掉,這樣就不用糾結,但是會丟失資訊
4 試證明“NFL”定理仍成立
數學功底不夠,就不做過程了,但是感覺這裡的“l()”函式應該就是用來表示f(x)與h(x)之間的距離的函式
5 機器學習在網際網路搜尋中的作用
“猜你喜歡”功能,搜尋時預搜尋等等