機器學習基石 Lecture1: The Learning Problem
阿新 • • 發佈:2018-11-11
機器學習基石 Lecture1: The Learning Problem
Course Introduction
Course Design
機器學習是個既包含理論也需要實踐的內容。本門課更注重基礎理論一點。包含了感性認識,關鍵理論,核心技術和實際的用途。包括以下內容:
What is Machine Learning
定義
人類學習:通過觀察獲得經驗取得技能。
機器學習:通過資料學得經驗獲取技能。一個更具體的定義如下:
機器學習通過從資料中獲得的經驗,從而提高了在某些評估中的表現。比如從過往股票交易的資料中得到一個能夠提高投資收益的演算法。
為何使用機器學習呢?若需要寫一個辨別樹的程式。如果想要先定義一棵樹,然後根據定義來寫一個判斷的程式非常困難。而實際上人不是根據定義來識別樹而是根據觀察(資料)。基於機器學習的樹辨別系統比硬編碼的方式更加簡單。
Key Essence of Machine Learning
- 需要有一些能夠學習潛在的模式,從而提高效率
- 但沒有一些簡單的可直接程式設計的定義,所以需要ML
- 而且需要有關於這些模式的資料,這是ML需要的輸入
有了這幾個元素的地方才適合使用機器學習。
Applications of Machine Learning
衣:時裝搭配
食:預測飯店是否會導致食物中毒
住:節能減排的能耗安排
行:自動駕駛識別交通指示
育:根據學習記錄預測學生成績
樂:電影或音樂推薦系統
Components of Learning
機器學習裡的基礎概念:
- 輸入x
- 輸出y
- 實際的從輸入集合到輸出集合的對映函式f,無法知道
- 訓練資料D,由一個一個輸入輸出對(x,y)組成
- 對於實際函式f的假設函式g,也就是學到的能夠有較好表現的技能。
因此機器學習就是從由 生成的(x,y)資料對中,通過演算法 來從所有的假設函式的集合 中學到一個對於實際函式f的估計函式g。
Machine Learning and Other Fields
機器學習:從資料中學習到假設g去逼近目標f
資料探勘:使用大量資料找到有意義的性質
相比:兩個很難區分但是並不相同
人工智慧:計算一些能夠體現出智慧的東西
相比:ML可以看做實現AI的方式
統計學:通過資料對未知過程進行推導
相比:統計學可以看成ML的工具