機器學習綜述

阿新 • • 發佈：2018-02-07

view nes weight 線性回歸識別 least map 降維 ner

引用的文檔

A Survey on Machine Learning: Concept, Algorithms and Applications

A survey of machine learning

Machine Learning, Tom Mitchell 1997 | PDF下載

**百度網盤下載地址：https://pan.baidu.com/s/1jJLVfpG**

**IPFS下載地址：https://ipfs.io/ipfs/QmV5oWgZwH652T15fhVuGrQaou4p6y1aRfxde6HVXMHkPj**

機器學習是交叉學科，跨計算機科學和統計學領域。與之類似的研究領域，人或動物的神經科學領域。

數據挖掘、人工智能和機器學習三個學科是交叉的，有重疊的。

發展歷史

第一階段是在20世紀50年代中葉到60年代中葉，屬於熱烈時期。
第二階段是在20世紀60年代中葉至70年代中葉，被稱為機器學習的冷靜時期。
第三階段是從20世紀70年代中葉至80年代中葉，稱為復興時期。
機器學習的最新階段始於1986年。

研究領域和相關工作

非標註數據的有監督學習
學習經驗的可傳遞
鏈接不同的ML算法
學習者如何主動收集自己需要的數據
隱私保護數據挖掘
Never-Ending Learners (永無止境的學習者)

研究領域的另外一種分類

有監督學習
無監督學習
增強學習

主要的研究方向

數據挖掘
- 目的：從已有數據中發現模式，應用於趨勢預測、分類、聚類、頻繁模式等
- 常見問題：過擬合、評估假設、隱私問題
人工神經網絡
增強學習

機器學習算法分類

根據學習方式分類
1. 有監督學習
  1. 線性回歸
  2. 最近鄰
  3. ID3 (基於決策樹)
2. 無監督學習
3. 半監督學習
4. 增強學習
根據相似度分類
1. 回歸算法 (Regression Alg)
  1. Linear Regression, Logistic Regression, Stepwise Regression , Ordinary Least Squares Regression (OLSR), Multivariate Adaptive Regression Splines (MARS) , Locally Estimated Scatterplot Smoothing (LOESS)
2. 基於實例的算法 (Instance-based Alg)
  1. K-Nearest Neighbour (KNN), Learning Vector Quantisation (LVQ), Self-Organising Map (SOM), Locally Weighted Learning (LWL)
3. 規則化 (Regularisation Algorithm)
  1. 主要指範數規則化
4. 決策樹算法 (Decision Tree Alg)
  1. Classification and Regression Tree (CART), Iterative Dichotomiser 3 (ID3), C4.5 and C5.0, Chi-squared AutomaticInteraction Detection (CHAID) , Decision Stump, M5, Conditional Decision Trees
5. 貝葉斯算法 (Bayesian Alg)
  1. Naive Bayes, Gaussian Naive Bayes, Multinomial Naive Bayes, Averaged One-Dependence Estimators
    (AODE), Bayesian Belief Network (BBN), Bayesian Network (BN)
6. 支持向量機 (Support Vector Machine - SVM)
7. 聚類 (Clustering Alg)
  1. K-Means, K-Medians, Affinity Propagation, Spectral Clustering, Ward hierarchical clustering, Agglomerative clustering. DBSCAN, Gaussian Mixtures, Birch, Mean Shift, Expectation Maximisation (EM)
8. 關聯規則學習算法
9. 人工神經網絡算法 (Artificial Neural Network Alg)
  1. Perceptron, Back- Propagation, Hop-field Network, Radial Basis Function Network (RBFN)
10. 深度學習算法 (Deep Learning Alg)
  1. Deep Boltzmann Machine (DBM), Deep Belief Networks (DBN), Convolutional Neural Network (CNN), Stacked Auto-Encoders
  2. 它是ANN的特定分支
11. 降維算法
  1. Principal Component Analysis (PCA), Principal Component Regression (PCR), Partial Least Squares Regression (PLSR), Sammon Mapping, Multidimensional Scaling (MDS), Projection Pursuit, Linear Discriminant Analysis (LDA), Mixture Discriminant Analysis (MDA), Quadratic Discriminant Analysis (QDA), Flexible Discriminant Analysis (FDA)
12. 算法集成 (Ensemble)
  1. Boosting, Bootstrapped Aggregation (Bagging), AdaBoost, Stacked Generalisation (blending), Gradient Boosting Machines (GBM), Gradient Boosted Regression Trees (GBRT), Random Forest, Extremely Randomised Trees
    
    主要應用
語音識別
機器視覺
監控
機器人或自動化控制
實證科學實驗
其他：spam filtering, fraud detection, topic identification and predictive analytics等

未來

解釋人類的學習能力
帶有ML原語的編程語言
認知

機器學習綜述

view nes weight 線性回歸識別 least map 降維 ner 引用的文檔 A Survey on Machine Learning: Concept, Algorithms and Applications A survey of machine lea

機器學習綜述與“Hello World”實戰

本文結構思維導圖概述友情提示： 1. 對於本文中資料集，訓練集，特徵點，空間等基礎概念，請參考周志華老師的《機器學習》第一章的內容 2. Python的語法並不難理解，有編碼基礎的可以直接看懂，如果不懂，請參考廖雪峰老師的個人部落格中Python的教學內容&nbs

機器學習與資料科學基於R的統計學習方法（一)-第1章機器學習綜述

1.1 機器學習的分類監督學習：線性迴歸或邏輯迴歸，非監督學習：是K-均值聚類，即在資料點集中找出“聚類”。另一種常用技術叫做主成分分析（PCA），用於降維，演算法的評估方法也不盡相同。最常用的方法是將均方根誤差（RMSE）的值降到最小，這一數值用於評價測試集的預測結果是否準確。 R

機器學習綜述——機器學習理論基礎與發展脈絡

機器學習是人工智慧研究發展到一定階段的必然產物。從 20 世紀50 年代到 70 年代初，人工智慧研究處於“推理期”，人們認為只要給機器賦予邏輯推理能力，機器就能具有智慧。這一階段的代表性工作主要有 A. Newell 和 H. Simon 的“邏輯理論家”程式以及此後的“通用問題求解”程式等，這些工

【機器學習基石筆記】一、綜述

model 但是目標學習 imp 選擇處理定義條件課程定位：註重基礎、故事性機器學習定義： data - Algo - improve 機器學習使用條件 1、有優化的目標，可量化的。 2、規則不容易寫下來，需要學習。 3、要有數據一個可能的推薦

【機器學習】生成式對抗網路模型綜述

生成式對抗網路模型綜述摘要生成式對抗網路模型(GAN)是基於深度學習的一種強大的生成模型，可以應用於計算機視覺、自然語言處理、半監督學習等重要領域。生成式對抗網路最最直接的應用是資料的生成，而資料質量的好壞則是評判GAN成功與否的關鍵。本文介紹了GAN最初被提出時的基本思想，闡述了其一步

終身機器學習（Lifelong Machine Learning）綜述

大概有十幾天了沒有回來更新部落格了吧，這期間遇到了大大小小各種事情，最悲傷的事應該是跟我關係最好的一個哥們的父親去世了，被酒駕的人撞了，希望叔叔在天國安好！再次告誡各位開車一定不能喝酒，不只是對自己負責，也是對他人生命的尊重，在這裡謝過大家了！下面說一說我這些天積累的一

機器學習中的資料清洗與特徵處理綜述

https://tech.meituan.com/machinelearning_data_feature_process.html 機器學習中的資料清洗與特徵處理綜述 caohao ·2015-02-10 11:30 背景隨著美團交易規模的逐步增大，積

【特徵工程】2 機器學習中的資料清洗與特徵處理綜述

背景隨著美團交易規模的逐步增大，積累下來的業務資料和交易資料越來越多，這些資料是美團做為一個團購平臺最寶貴的財富。通過對這些資料的分析和挖掘，不僅能給美團業務發展方向提供決策支援，也為業務的迭代指明瞭方向。目前在美團的團購系統中大量地應用到了機器學習和資料探勘技術，例

機器學習筆記之tensorflow綜述

tensorflow張量理解零階張量就是一個數，一階張量是一個向量（類似於一維陣列），二階張量是矩陣（類似於二維陣列），三階張量類似於三維陣列，以此類推。張量的階與矩陣的階不是一個概念，需要注意。

機器學習第三練：為慈善機構尋找捐助者

alt earch .get 變量照相標簽 log 比較 random 這個任務同樣是在Jupyter Notebook中完成，項目目的是通過前面的所有特征列，當然去掉序號列，然後預測最後一列，收入‘income‘，究竟是大於50K，還是小於等於50K. 第一

機器學習筆記（Washington University）- Regression Specialization-week five

ril ... des stl it is idg evaluate date lec 1. Feature selection Sometimes, we need to decrease the number of features Efficiency: With f

【機器學習算法-python實現】PCA 主成分分析、降維

pre gre text iss 主成分分析 int 找到 nts 導入 1.背景 PCA(Principal Component Analysis)，PAC的作用主要是減少數據集的維度，然後挑選出基本的特征。 PCA的主要思想是移動坐標軸，找

機器學習筆記（Washington University）- Regression Specialization-week six

lar fec space cti different only similar ant var 1. Fit locally If the true model changes much, we want to fit our function locally to di

機器學習-KMeans聚類 K值以及初始類簇中心點的選取

src 常用趨勢試圖重復執行很大的一個點 3.4 選擇【轉】http://www.cnblogs.com/kemaswill/archive/2013/01/26/2877434.html 本文主要基於Anand Rajaraman和Jeffrey David

機器學習公開課筆記第九周之大數據梯度下降算法

機器學習 nbsp gradient min 三種依次再看獲得 mini 一，隨機梯度下降法(Stochastic Gradient Descent) 當訓練集很大且使用普通梯度下降法(Batch Gradient Descent)時，因為每一次\(\theta\)

機器學習筆記（四）機器學習可行性分析

資料表示 image 隨機訓練樣本 -s mage 例如 lin 從大量數據中抽取出一些樣本，例如，從大量彈珠中隨機抽取出一些樣本，總的樣本中橘色彈珠的比例為，抽取出的樣本中橘色彈珠的比例為，這兩個比例的值相差很大的幾率很小，數學公式表示為：用抽取到的樣本作為訓練

機器學習筆記（六）邏輯回歸

邏輯回歸 alt 表示結果不變改變最小值 nbsp 可能性一、邏輯回歸問題二分類的問題為是否的問題，由算出的分數值，經過sign函數輸出的是（+1，-1），想要輸出的結果為一個幾率值，則需要改變函數模型，其中，，則邏輯回歸的函數為二、邏輯回歸錯誤評價線性

Ng第十一課：機器學習系統的設計(Machine Learning System Design)

未能計算公式 pos 構建我們行動 mic 哪些指標 11.1 首先要做什麽 11.2 誤差分析 11.3 類偏斜的誤差度量 11.4 查全率和查準率之間的權衡 11.5 機器學習的數據 11.1 首先要做什麽在接下來的視頻將談到機器

機器學習筆記（八）非線性變換

nbsp 線性 logs 等於線性模型 images http 自己空間一、非線性問題對於線性不可分的數據資料，用線性模型分類，Ein會很大，相應的Ein=Eout的情況下，Eout也會很大，導致模型表現不好，此時應用非線性模型進行分類，例如：分類器模型是一個圓

機器學習綜述

發展歷史

研究領域和相關工作

研究領域的另外一種分類

主要的研究方向

機器學習算法分類

主要應用

未來

相關推薦