機器學習 周誌華 第1章習題
習題1.1
做這道題要弄青版本空間和假設空間的概念
我的理解是假設空間就是所有屬性值的可能組合到一起,這道題就是 3 * 3 * 3 + 1 = 28種
假設空間書上給的定義是:可能有多個假設與訓練集一致,即存在著一個與訓練集一致的“家設計和”,我們稱之為“版本空間”(version space)
所有我們先求出假設空間,再次說明,有 3 * 3 * 3 + 1 = 28種,分別是:
- (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=濁響)
- (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=沈悶)
- (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=*)
- (色澤=青綠) Λ(根蒂=稍蜷)Λ(敲聲=濁響)
- (色澤=青綠) Λ(根蒂=稍蜷)Λ(敲聲=沈悶)
- (色澤=青綠) Λ(根蒂=稍蜷)Λ(敲聲=*)
- (色澤=青綠) Λ(根蒂=*)Λ(敲聲=濁響)
- (色澤=青綠) Λ(根蒂=*)Λ(敲聲=沈悶)
- (色澤=青綠) Λ(根蒂=*)Λ(敲聲=*)
- (色澤=烏黑) Λ(根蒂=蜷縮)Λ(敲聲=濁響)
- (色澤=烏黑) Λ(根蒂=蜷縮)Λ(敲聲=沈悶)
- (色澤=烏黑) Λ(根蒂=蜷縮)Λ(敲聲=*)
- (色澤=烏黑) Λ(根蒂=稍蜷)Λ(敲聲=濁響)
- (色澤=烏黑) Λ(根蒂=稍蜷)Λ(敲聲=沈悶)
- (色澤=烏黑) Λ(根蒂=稍蜷)Λ(敲聲=*)
- (色澤=烏黑) Λ(根蒂=*)Λ(敲聲=濁響)
- (色澤=烏黑) Λ(根蒂=*)Λ(敲聲=沈悶)
- (色澤=烏黑) Λ(根蒂=*)Λ(敲聲=*)
- (色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=濁響)
- (色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=沈悶)
- (色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=*)
- (色澤=*) Λ(根蒂=稍蜷)Λ(敲聲=濁響)
- (色澤=*) Λ(根蒂=稍蜷)Λ(敲聲=沈悶)
- (色澤=*) Λ(根蒂=稍蜷)Λ(敲聲=*)
- (色澤=*) Λ(根蒂=*)Λ(敲聲=濁響)
- (色澤=*) Λ(根蒂=*)Λ(敲聲=沈悶)
- (色澤=*) Λ(根蒂=*)Λ(敲聲=*)
- Φ
然後我們選出符合訓練集 (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=濁響) (色澤=烏黑) Λ(根蒂=稍蜷)Λ(敲聲=沈悶)
一般情況下版本空間是正例的泛化,但由於數據集中只有1個正例,所以在版本空間中依然包含了這個樣本的假設,選出了如下符合數據集
1. (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=濁響)
3. (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=*)
7. (色澤=青綠) Λ(根蒂=*)Λ(敲聲=濁響)
9. (色澤=青綠) Λ(根蒂=*)Λ(敲聲=*)
19. (色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=濁響)
21.(色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=*)
25.(色澤=*) Λ(根蒂=*)Λ(敲聲=濁響)
共7個
習題1.2
根據表1.1和假設空間的含義我們可以得出,空間規模大小為3 * 4 * 4 + 1 = 49
所以k最大取49,所以總的數量就有∑C(49)(i) (就是排列組合裏的C)
因為最大取49,所以取48, 47都可以,所以要求和
結果為2的49次方,求和計算方法如下
註:我沒有考慮像(色澤=*,根蒂=*,敲聲=濁響)∨(色澤=*,根蒂=*,敲聲=清脆)∨(色澤=*,根蒂=*,敲聲=沈悶)與(色澤=烏黑,根蒂=*,敲聲=*)∨(色澤=青綠,根蒂=*,敲聲=*)是同一種假設,它們都表示(色澤=*,根蒂=*,敲聲=*),這種多余情況。
習題1.3
去燥,若存在兩個樣例屬性取值都相同,標記卻不同,則只保留標記為正例的樣例
機器學習 周誌華 第1章習題