【機器學習理論】第1部分機器學習基礎

阿新 • • 發佈：2019-01-26

對於機器學習演算法也使用了一段時間，現在進行一個系統的學習和總結，也給自己補缺補差，回頭來看，發現對於機器學習的理解更加的清晰，更加有條理，在整體的思路上的把握也更加的完善，所以建議對於機器學習的學習一定要多實踐，多回頭檢視、

【分類介紹】

監督學習：在監督學習中，我們只需要給定輸入樣本集，機器就可以從中推測出指定目標變數的可能結果。

監督學習使用兩種型別的目標變數：標稱型和數值型。

標稱型：其目標變數的結果只在有限目標集中取值，如真與假、動物分類集合{爬行類、魚類、哺乳類}

數值型：其目標變數可以從無限的數值集合中取值，如1.002、42.001、100.58等

【機器學習的簡單概述】

利用計算機來彰顯資料背後的真實含義，這才是機器學習的真實含義。

機器學習的使用是非常廣泛的，在這個過程中可以包括：人臉識別、手寫數字識別、垃圾郵件過濾和亞馬遜公司的產品推薦等。

【何為機器學習】

機器學習就是把無序的資料轉換成有用的資訊。

如何能夠準確預測人類當前60%的行為？怎樣預測人們所參與時間的結果呢？如何預測在美國大選中總統競選的比例呢？

【機器學習的重要性】

二義性問題：“最大化利潤”、“最小化風險”、“最好的市場策略”……..

如何解釋資料、處理資料、從資料中抽取價值、展示和交流資料結果，這將是我們所討論的重要問題。

【關鍵術語】

以鳥類分類系統為例：

基於四種特徵的鳥物種分類表：

-	體重	翼展	腳蹼	後背顏色	種類
1	1000.1	125.0	無	棕色	紅尾鳥
2	3000.7	200.0	無	灰色	鷺鷹
3	3300.0	220.3	無	灰色	鷺鷹
4	4100.0	136.0	有	黑色	普通千鳥
5	3.0	11.0	無	綠色	瑰麗蜂鳥
6	570.0	75.0	無	黑色	象牙啄木鳥

從表中可以發現，所使用的是鳥類的四種特徵，前兩種特徵為數值型，第三種特徵為二值型，第四種特徵為自定義的列舉型別。

機器學習的首要任務就是分類，如何從資料中獲取相關的資料，並對資料進行一定的處理，來對資料進行分類，並將結果應用到資料的預測當中，這也就是機器學習的根本目的。

對於分類來說，首要的就是如何進行演算法的訓練，通常為演算法的輸入大量已分類資料作為演算法的訓練集，訓練集是用於訓練機器學習演算法的資料樣本集合。目標變數是機器學習演算法的預測結果，在分類演算法中目標變數的型別通常是離散型的，而在迴歸演算法中通常是連續型的。

【機器學習的主要任務】

機器學習的主要任務就是分類，將例項資料劃分到合適的分類中。

機器學習的另一項任務就是迴歸，用於預測數值型資料，通過資料擬合曲線來進行資料擬合，預測可能的結果。

分類和迴歸都屬於監督學習，監督學習就是必須首先要知道預測什麼，即目標變數的分類資訊。

而非監督學習，則是在資料上並沒有類別資訊，也不會給定目標值；在非監督學習中，將資料集合分成由類似的物件組成的多個類的過程被稱為聚類，將尋找描述資料統計值的過程稱為密度估計。

用於執行分類、迴歸、聚類和密度估計的機器學習演算法

監督學習的用途
k近鄰演算法	線性迴歸
樸素貝葉斯演算法	區域性加權線性迴歸
支援向量機	Ridge迴歸
決策樹	Lasso最小回歸係數估計

無監督學習的用途
k-均值	最大期望演算法
DBSCAN	Parzen窗設計

【演算法的選擇】

如果要預測目標變數的值，則可以選擇監督學習演算法，否則可以選擇非監督學習演算法。

對於監督學習演算法：如果目標變數是離散型，如是/否、1/2/3、A/B/C等相關的資料，可以使用分類演算法；

如果目標變數是連續型，如0.0~100.0、-999~999，則選擇迴歸演算法。

對於非監督學習演算法：如果需要將資料劃分為離散的組，則使用聚類演算法；

如果還需要估計資料與每個分組的相似程度，則需要使用密度估計演算法。

【開發機器學習應用程式的步驟】

1、收集資料

2、準備輸入資料

3、分析輸入資料

4、訓練演算法

5、測試演算法

6、使用演算法

【機器學習理論】第1部分機器學習基礎

對於機器學習演算法也使用了一段時間，現在進行一個系統的學習和總結，也給自己補缺補差，回頭來看，發現對於機器學習的理解更加的清晰，更加有條理，在整體的思路上的把握也更加的完善，所以建議對於機器學習的學習一定要多實踐，多回頭檢視、【分類介紹】

【機器學習實戰】第1章機器學習基礎

第1章機器學習基礎機器學習概述機器學習就是把無序的資料轉換成有用的資訊。獲取海量的資料從海量資料中獲取有用的資訊我們會利用計算機來彰顯資料背後的真實含義，這才是機器學習的意義。機器學習場景例如：

【機器學習系列文章】第1部分：為什麼機器學習很重要？

目錄路線圖關於作者簡單，簡單的解釋，附有數學，程式碼和現實世界的例子。這個系列是一本完整的電子書！在這裡下載。免費下載，貢獻讚賞（paypal.me/ml4h）路線圖第1部分：為什麼機器學習很重要。人工智慧和機器學習的大

【PHP微職位】第1天學習筆記

核心工程階段基礎基礎篇 php 項目 3.x art 2018年8月22日學習內容：第一節開班典禮以及課堂體系概述【基礎預科】1、HTML5(Web設計入門基礎)視頻課程【1~2周】【必學】2、Bootstrap(HTML5前端庫設計開發)視頻課程【1周】【必學

【HTTP權威指南】第1 章　HTTP 概述

1.4 狀態 1.8 網關資源 ip 地址 gen 歷史客戶端 1.1　HTTP——因特網的多媒體信使 ...................................................................................

【英語初階】第1月回顧

總結國外除了拓展 gpo 快速在一起時也目標回顧四級真題做了一篇，單詞過完了四級，六級過完1/3，聽力無，閱讀幾篇新聞。結果和改進百詞斬背單詞挺傻的，當然過一遍混個眼熟也無所謂，不能指望真背完了能用起來之前幾乎每天倆小時地用百詞斬背單詞，四級復習45

【構建之法】第1章概論

order ble 可見性科學行為 summary 模式 enter strong 1 公式軟件 = 程序 + 軟件工程軟件的質量 = 程序的質量 + 軟件工程的質量程序 = 數據結構 + 算法軟件企業 = 軟件 + 商業模式 2 軟件的特殊性復

【Linux學習筆記】第8章 Linux shell基礎知識

linux centos shell 通配 8.1shell介紹shell是一個命令解釋器，提供人機交互。支持特定語法。每個用戶都可以有自己特定的shell（bash）。CentOS7默認bash（Bourne Agin Shell）。其他還有zsh、ksh等。 8.2命令歷史命令歷史存放於

MOOC【Python語言程式設計】- 第1周-選擇題

1.‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬Guido van Rossum正式對外發布Python版本的年份是：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬

【springboot 入門篇】第1篇第一個spring-boot程式（多種搭建方式）

學習一個新技術，先別管他的原理啊，流程啊，怎麼組織程式碼啊什麼的。直接從官網或者部落格抄一個小demo，自己親自跑一遍，然後再去看那一堆讓人頭皮發麻的講解，就能相對容易的看懂了。初學者的態度應該是：不要問我為什麼，反正我就是可以這樣執行！ 1. 建立一個spring boot專案可以使用

【蛻變之路】第1天規劃（2019年2月19日）

每日分享左右一個十分鐘等等英語籃球記錄聲明：本人是一名剛步入社會的職場小白，主要從事Java後端開發。開啟【蛻變一路】系列主要是為了記錄每日學習、思考以及總結的情況，目的是為了不斷挑戰自己，提升

（6）第1部分：C++基礎的尾巴~

區別 nbsp 自己字符串處理函數處理 com bsp 操作串處理這篇文章有問題！！！待改 2.6.3編寫自己的頭文件P67中提到：“庫類型string在名為string的頭文件中定義。又如，我們應該把Sales_data類定義在名為Sales_data.h的頭

【機器學習系列文章】第6部分：最好的機器學習資源

目錄基金會程式設計線性代數概率與統計微積分機器學習培訓教科書深度學習培訓專案閱讀強化學習培訓專案閱讀人工智慧簡訊別人的建議製作人工智慧，機器學習和深度學習課程的資源彙編。關於制定課

【機器學習系列文章】第5部分：強化學習

目錄你做到了！結束思考探索和開發。馬爾可夫決策過程。Q-learning，政策學習和深度強化學習。 “我只吃了一些巧克力來完成最後一節。” 在有監督的學習中，訓練資料帶有來自某些神聖的“主管”的答案。如果只有這樣的生活！在強化學

【機器學習】第4部分關聯分析

# -*- coding:utf-8 -*- import itertools import copy ''' 定義全域性變數k，即支援度計數k,此k也可以在執行程式之前輸入，簡單改動即可 ''' k = 2 ''' 儲存頻繁項集的列表 ''' frequenceItem = [] ''' 從txt檔

【機器學習實戰】第13章利用 PCA 來簡化數據

light nan 文本 com axis 均值 ... cati 二維空間第13章利用 PCA 來簡化數據降維技術場景我們正通過電視觀看體育比賽，在電視的顯示器上有一個球。顯示器大概包含了100萬像素點，而球則可能是由較少的像素點組成，例如說一千個像素

【轉】虛擬機遷移技術漫談，第 1 部分

遷移方法電力 list ews IT 全面 dev 處理器自動化工具如何在虛擬機和物理機以及虛擬機和虛擬機之間的遷移系統郭晉兵和吳超鳳2010 年 9 月 09 日發布

【譯】使用OpenVAS 9進行漏洞掃描第1部分：安裝和設定

　　本文《使用OpenVAS 9進行漏洞掃描第1部分：安裝》譯自Vulnerability Scanning with OpenVAS 9 part 1: Installation & Setup 　　幾年前，我們在Hacking Tutorials上做了一個關於如何在Kali

【2018可信雲大會】信通院陳屹力：《分散式應用架構技術能力要求第1部分：微服務平臺》標準解讀

陳屹力：感謝主持人，再次感謝今天下午到場的各位嘉賓，今天下午的議題是一個標準解讀，同時也是微服務標準歷經了大概半年時間正式釋出，目前標準正在徵求意見階段，後面我們再同步跟進送審稿，最終釋出大概在9月份，待會兒我會詳細介紹。首先說一下微服務的定

【深入理解JVM虛擬機器】第1章走進java

1.1Java技術體系 Sun 官方定義的Java技術體系包括以下幾個組成部分： Java 程式設計語言各種硬體平臺上的 Java 虛擬機器 Class 檔案格式 Java API 類庫第三方 Java 類庫 1.1.1 Java API 按照技術所服

【機器學習理論】第1部分 機器學習基礎

【分類介紹】

【機器學習的簡單概述】

【何為機器學習】

【機器學習的重要性】

【關鍵術語】

【機器學習的主要任務】

【演算法的選擇】

【開發機器學習應用程式的步驟】

相關推薦

【機器學習理論】第1部分機器學習基礎