【勘誤清單】《機器學習》 周志華 北京: 清華大學出版社
相關推薦
【勘誤清單】《機器學習》 周志華 北京: 清華大學出版社
p.6, 圖1.2: 圖中兩處"清脆" --> "濁響"p.28, 第3段倒數第2行: "大量" --> "不少"p.28, 邊注: "例如 ……上百億個引數" --> "機器學習常涉及兩類引數: 一類是演算法的引數, 亦稱"超引數", 數目常在10以內; 另一類是模型的引數, 數目可能很
機器學習-周志華-第一章
緒論 1.1 引言 什麼是機器學習? 它是一門致力於研究如何通過計算的手段,利用經驗來改善系統自身效能的一門學科。所研究的主要內容是計算機如何通過資料產生模型,即學習演算法。有了學習演算法後,當我們給它提供經驗資料時就能基於這些資料產生模型。在面對新資料時學習演算法會給我們相應的判斷。經驗通常以資料的形
機器學習 周志華筆記
已經發布部落格 ************************************************************ 周志華教授 機器學習教材總結 資料和特徵決定了機器學習的上限,而模型和演算法只是逼近這個上限而已 問題總結: 生成式模型
學習筆記 | 機器學習-周志華 | 5
第二章 模型評估與選擇 2.1 經驗誤差與過擬合 "錯誤率" (error rate) ,即如果在 m 個樣本中有 α 個樣本分類錯誤,則錯誤率 E= α/m; 1 一 α/m 稱為**“精度” (accuracy)** ,即"精度 =1 - 錯誤率" 更一般地,
學習筆記 | 機器學習-周志華 | 4
習題 版本空間:存在著一個與訓練集一致的“假設集合”。 此時,只有1, 4兩個樣例。 求版本空間的步驟: ①寫出假設空間:先列出所有可能的樣本點(即特徵向量)(即每個屬性都取到所有的屬性值) ②對應著給出的已知資料集,將與正樣本不一致的、與負樣本一致的假設刪除。 ③得出與
學習筆記 | 機器學習-周志華 | 3
1.4 歸納偏好 版本空間中的多個假設可能會產生不同的輸出: 對於同一個樣本,產生不同結果。 這時,學習演算法本身的"偏好"就會起到關鍵的作用. 機器學習演算法在學習過程中對某種型別假設的偏好,稱為"歸納偏好" (inductive bias),或簡稱為"偏好"。 任何
學習筆記 | 機器學習-周志華 | 2
1.3 假設空間 歸納 (induction)與演繹 (deduction)是科學推理的兩大基本手段。 歸納:從特殊到一般的"泛化" (generalization)過程,即從具體的事實歸結出一般性規律。 演繹:從一般到特殊的"特化" (specializa
學習筆記 | 機器學習-周志華 | 1
第一章 緒論 機器學習所研究的主要內容,是關於在計算機上從資料中產生 模型(model) 的演算法,即 “學習演算法”(learning algorithm) . 基本術語 假定我們收集了一批關於西瓜的資料,例如(色澤=青綠;根蒂=蜷縮;敲聲=濁響), (色澤=烏黑;根蒂:稍蜷;
機器學習-周志華-課後習題答案5.5
5.5 試程式設計實現標準BP演算法和累計BP演算法,在西瓜資料集3.0上分別用這兩個演算法訓練一個單隱層網路,並進行比較。 通過程式設計實踐發現,在本例下要達到某一限定的均方誤差時,標準BP演算法比累積BP演算法明顯收斂更快,特別在本例中,將ABP演算法誤差設定到0.0
機器學習(周志華) 參考答案 第十六章 強化學習
機器學習(周志華西瓜書) 參考答案 總目錄 是時候讓自己的機器更強大一些了,順便完結撒花 1.用於K-搖臂賭博機的UCB方法每次選擇Q(k)+UC(k)的最大的搖臂,其中Q(k)為搖臂k當前的平均獎賞,UC(k)為置信區間。例如Q(k)
機器學習(周志華西瓜書) 參考答案 總目錄
機器學習(周志華西瓜書)參考答案總目錄 從剛開始學習機器學習到現在也有幾個月了,期間看過PDF,上過MOOC,總感覺知道一點了又不是特別明白,最後趁某東買書大減價弄了幾本相關的書來看看,其中一本就是西瓜書。一口氣看了前10章,感覺每章內容都很少,看完感覺還是和以前一樣。
機器學習--周志華(第1章)
第1章 緒論 符號學習--->統計機器學習 機器學習中代數一般是作為基礎工具來使用 總結:出頭露面的是概率和統計,埋頭苦幹的是代數和邏輯。 機器學習是關於在計算機上從資料中產生“模型”的演算法,即學習演算法。 學得模型對應了關於資料的某種潛在的規律,因此亦稱“假設”。這
機器學習(周志華) 參考答案 第三章 線性模型 3.3
一:matlab實現 1.資料的Excel處理 西瓜資料集3.0 2.程式碼 # -*- coding: utf-8 -*- old_l = 0; n = 0; b = [0;0;1]; %對應書中(3.25)下的B=(w;b),因為x有兩個屬性:
機器學習(周志華) 參考答案 第一章 緒論
機器學習(周志華) 參考答案 第一章 緒論 機器學習(周志華西瓜書) 參考答案 總目錄 1.表1.1中若只包含編號為1,4的兩個樣例,試給出相應的版本空間。 假設空間指的是問題所有假設組成的空間,我們可以把學習過程看作是在假設空間中搜索的過程,
機器學習(周志華) 參考答案 第十四章 概率圖模型
機器學習(周志華西瓜書) 參考答案 總目錄 1.試用盤式記法表示條件隨機場和樸素貝葉斯分類器。 條件隨機場: 這樣畫的問題在於無法表示N個y之間的關係,到底怎麼畫我也不知道。 樸素貝葉斯分類器:y依賴於所有的變數x 2.證明
機器學習-周志華-個人練習11.1
11.1 試程式設計實現Relief演算法,並考察其在西瓜資料集3.0上的執行結果。 本題採用Relief演算法處理二分類任務,雖然書上只要求對連續屬性歸一化,但我將離散屬性的值轉化為了1,2,3,如果不對離散屬性歸一化,顯然在查詢近鄰時連續屬性不能有效發揮作用,因此需要將
機器學習-周志華-課後習題答案-線性模型
3.1試分析在什麼情況下,在以下式子中不比考慮偏置項b。答:線上性迴歸中,所有引數的確定都是為了讓殘差項的均值為0且殘差項的平方和最小。在所有其他引數項確定後,偏置項b(或者說是常數項)的變化體現出來的就是擬合曲線的上下整體浮動,可以看做是其他各個解釋變數留下的bias的線性
機器學習(周志華) 參考答案 第四章 決策樹 python重寫版與畫樹演算法
機器學習(周志華西瓜書) 參考答案 總目錄 機器學習(周志華) 參考答案 第四章 決策樹 3.試程式設計實現基於資訊熵進行劃分選擇的決策樹演算法,併為表4.3中資料生成一棵決策樹。 最近在學著用python,所以用py重寫了以前的決策樹程式碼,
機器學習-周志華-個人練習13.4
13.4 從網上下載或自己程式設計實現TSVM演算法,選擇兩個UCI資料集,將其中30%的樣例用作測試樣本,10%的樣例用作有標記樣本,60%的樣例用作無標記樣本,分別訓練出利用無標記樣本的TSVM以及僅利用有標記樣本的SVM,並比較其效能。 選擇最常用的ir
機器學習(周志華) 參考答案 第二章 模型評估與選擇
機器學習(周志華) 參考答案 第二章 模型評估與選擇 機器學習(周志華西瓜書) 參考答案 總目錄 1.資料集包含1000個樣本,其中500個正例,500個反例,將其劃分為包含70%樣本的訓練集和30%樣本的測試集用於留出法評估,試估算共有多少種