1. 程式人生 > >機器學習 周誌華 第1章習題

機器學習 周誌華 第1章習題

空間 ont 概念 ron 裏的 strong 機器學習 排列組合 可能

習題1.1

  做這道題要弄青版本空間和假設空間的概念

  我的理解是假設空間就是所有屬性值的可能組合到一起,這道題就是 3 * 3 * 3 + 1 = 28種

  假設空間書上給的定義是:可能有多個假設與訓練集一致,即存在著一個與訓練集一致的“家設計和”,我們稱之為“版本空間”(version space)

  所有我們先求出假設空間,再次說明,有 3 * 3 * 3 + 1 = 28種,分別是:

  1.   (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=濁響)
  2.   (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=沈悶)
  3.   (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=*)
  4.   (色澤=青綠) Λ(根蒂=稍蜷)Λ(敲聲=濁響)
  5.   (色澤=青綠) Λ(根蒂=稍蜷)Λ(敲聲=沈悶)
  6.   (色澤=青綠) Λ(根蒂=稍蜷)Λ(敲聲=*)
  7.   (色澤=青綠) Λ(根蒂=*)Λ(敲聲=濁響)
  8.   (色澤=青綠) Λ(根蒂=*)Λ(敲聲=沈悶)
  9.   (色澤=青綠) Λ(根蒂=*)Λ(敲聲=*)
  10.   (色澤=烏黑) Λ(根蒂=蜷縮)Λ(敲聲=濁響)
  11.   (色澤=烏黑) Λ(根蒂=蜷縮)Λ(敲聲=沈悶)
  12.   (色澤=烏黑) Λ(根蒂=蜷縮)Λ(敲聲=*)
  13.   (色澤=烏黑) Λ(根蒂=稍蜷)Λ(敲聲=濁響)
  14.   (色澤=烏黑) Λ(根蒂=稍蜷)Λ(敲聲=沈悶)
  15.   (色澤=烏黑) Λ(根蒂=稍蜷)Λ(敲聲=*)
  16.   (色澤=烏黑) Λ(根蒂=*)Λ(敲聲=濁響)
  17.   (色澤=烏黑) Λ(根蒂=*)Λ(敲聲=沈悶)
  18.   (色澤=烏黑) Λ(根蒂=*)Λ(敲聲=*)
  19.   (色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=濁響)
  20.   (色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=沈悶)
  21.   (色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=*)
  22.   (色澤=*) Λ(根蒂=稍蜷)Λ(敲聲=濁響)
  23.   (色澤=*) Λ(根蒂=稍蜷)Λ(敲聲=沈悶)
  24.   (色澤=*) Λ(根蒂=稍蜷)Λ(敲聲=*)
  25.   (色澤=*) Λ(根蒂=*)Λ(敲聲=濁響)
  26.   (色澤=*) Λ(根蒂=*)Λ(敲聲=沈悶)
  27.   (色澤=*) Λ(根蒂=*)Λ(敲聲=*)
  28.   Φ

  然後我們選出符合訓練集  (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=濁響)  (色澤=烏黑) Λ(根蒂=稍蜷)Λ(敲聲=沈悶)

  一般情況下版本空間是正例的泛化,但由於數據集中只有1個正例,所以在版本空間中依然包含了這個樣本的假設,選出了如下符合數據集

  1. (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=濁響)

  3. (色澤=青綠) Λ(根蒂=蜷縮)Λ(敲聲=*)

  7. (色澤=青綠) Λ(根蒂=*)Λ(敲聲=濁響)

  9. (色澤=青綠) Λ(根蒂=*)Λ(敲聲=*)

  19. (色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=濁響)

  21.(色澤=*) Λ(根蒂=蜷縮)Λ(敲聲=*)

  25.(色澤=*) Λ(根蒂=*)Λ(敲聲=濁響)

  共7個

習題1.2

  根據表1.1和假設空間的含義我們可以得出,空間規模大小為3 * 4 * 4 + 1 = 49

   所以k最大取49,所以總的數量就有∑C(49)(i) (就是排列組合裏的C)

   因為最大取49,所以取48, 47都可以,所以要求和

   結果為2的49次方,求和計算方法如下

技術分享圖片

  註:我沒有考慮像(色澤=*,根蒂=*,敲聲=濁響)∨(色澤=*,根蒂=*,敲聲=清脆)∨(色澤=*,根蒂=*,敲聲=沈悶)與(色澤=烏黑,根蒂=*,敲聲=*)∨(色澤=青綠,根蒂=*,敲聲=*)是同一種假設,它們都表示(色澤=*,根蒂=*,敲聲=*),這種多余情況。

習題1.3

  去燥,若存在兩個樣例屬性取值都相同,標記卻不同,則只保留標記為正例的樣例

 

機器學習 周誌華 第1章習題