機器學習掌握知識點

阿新 • • 發佈：2018-11-12

一、人工智慧學習演算法分類

人工智慧演算法大體上來說可以分類兩類：基於統計的機器學習演算法(Machine Learning)和深度學習演算法(Deep Learning)

總的來說，在sklearn中機器學習演算法大概的分類如下：

1. 純演算法類

(1).迴歸演算法
(2).分類演算法
(3).聚類演算法
(4)降維演算法
(5)概率圖模型演算法
(6)文字挖掘演算法
(7)優化演算法
(8)深度學習演算法

2.建模方面

(1).模型優化
(2).資料預處理

二、詳細演算法

1.分類演算法

(1).LR (Logistic Regression，邏輯迴歸又叫邏輯分類)
(2).SVM (Support Vector Machine，支援向量機)
(3).NB (Naive Bayes，樸素貝葉斯)
(4).DT (Decision Tree，決策樹)

1).C4.5
2).ID3
3).CART

(5).整合演算法

1).Bagging
2).Random Forest (隨機森林)
3).GB(梯度提升,Gradient boosting)
4).GBDT (Gradient Boosting Decision Tree)
5).AdaBoost
6).Xgboost

(6).最大熵模型

2.迴歸演算法

(1).LR (Linear Regression，線性迴歸)
(2).SVR (支援向量機迴歸)
(3). RR (Ridge Regression，嶺迴歸)

3.聚類演算法

(1).Knn
(2).Kmeans 演算法
(3).層次聚類
(4).密度聚類

4.降維演算法

(1).SGD (隨機梯度下降)

5.概率圖模型演算法

(1).貝葉斯網路
(2).HMM
(3).CRF (條件隨機場)

6.文字挖掘演算法

(1).模型

1).LDA (主題生成模型，Latent Dirichlet Allocation)
2).最大熵模型

(2).關鍵詞提取

1).tf-idf
2).bm25
3).textrank
4).pagerank
5).左右熵 :左右熵高的作為關鍵詞

6).互資訊：

(3).詞法分析

1).分詞
– ①HMM (因馬爾科夫)
– ②CRF (條件隨機場)
2).詞性標註
3).命名實體識別

(4).句法分析

1).句法結構分析
2).依存句法分析

(5).文字向量化

1).tf-idf
2).word2vec
3).doc2vec
4).cw2vec

(6).距離計算

1).歐氏距離
2).相似度計算

7.優化演算法

(1).正則化

1).L1正則化
2).L2正則化

8.深度學習演算法

(1).BP
(2).CNN
(3).DNN
(3).RNN
(4).LSTM

三、建模方面

1.模型優化·

(1).特徵選擇
(2).梯度下降
(3).交叉驗證
(4).引數調優
(5).模型評估：準確率、召回率、F1、AUC、ROC、損失函式

2.資料預處理

(1).標準化
(2).異常值處理
(3).二值化
(4).缺失值填充：支援均值、中位數、特定值補差、多重插補

機器學習掌握知識點

一、人工智慧學習演算法分類人工智慧演算法大體上來說可以分類兩類：基於統計的機器學習演算法(Machine Learning)和深度學習演算法(Deep Learning) 總的來說，在sklearn中機器學習演算法大概的分類如下： 1. 純演算法類 (1).迴歸演算法 (2).分類演算法&

機器學習面試知識點之決策樹相關

決策樹面試知識點最全總結（一）一：首先明確以下幾個基本問題： 1.決策樹是幹什麼用的？一種最基本的分類與迴歸方法，因為實際應用中基本上全是用來分類，所以重點討論分類決策樹。 2.決策樹優缺點：優點： 1）

不得不瞭解的機器學習面試知識點

　　機器學習崗位的面試中通常會對一些常見的機器學習演算法和思想進行提問，在平時的學習過程中可能對演算法的理論，注意點，區別會有一定的認識，但是這些知識可能不繫統，在回答的時候未必能在短時間內答出自己的認識，因此將機器學習中常見的原理性問題記錄下來，保持對各個機器學習演算法原理和特點的熟練度。　　本文總結了機

機器學習小組知識點27：資料預處理之資料離散化（Data Discretization）

離散化和概念分層產生通過將屬性域劃分為區間，離散化技術可以用來減少給定連續屬性值的個數。區間的標號可以替代實際的資料值。如果使用基於判定樹的分類挖掘方法，減少屬性值的數量特別有好處。通常，這種方法是遞迴的，大量的時間花在每一步的資料排序上。因此，待排序的不同

機器學習基礎知識點歸納

一.生成模型與判別模型 1.概念介紹參考：https://blog.csdn.net/u012101561/article/details/52814571 參考：http://www.cnblogs.com/fanyabo/p/4067295.html 監督學習的任務是學習一個模型，對給

【面試複習系列】常用機器學習演算法知識點及其解析，面試官會考的幾乎都有，歡迎補充

圖片慢慢上傳，看不到圖片的請點這裡： LR：logistic regression 對數機率迴歸/邏輯迴歸 sigmoid函式的作用就是用於把輸出歸一到1和0，也就

機器學習-Pandas 知識點彙總(吐血整理)

Pandas是一款適用很廣的資料處理的元件，如果將來從事機械學習或者資料分析方面的工作，咱們估計70%的時間都是在跟這個框架打交道。那大家可能就有疑問了，心想這個破玩意兒值得花70%的時間嗎？咱不是還有很牛逼的Tensorflow, keras,神經網路，classification等等這些牛逼的技術（詞彙）

常用的機器學習&數據挖掘知識點總結

知識點總結 sca pac -i 期望最大似然算法 ucf space Basis(基礎)： MSE(Mean Square Error 均方誤差)，LMS(LeastMean Square 最小均方)，LSM(Least Square Methods 最小二乘法)，

普通碼農入門機器學習，必須掌握這些數據技能

散點掃描如果商品它的朋友良好的 target 萬能其實，機器學習一直在解決著各種重要的問題。比如說90年代中期，人們已經開始用神經網絡來掃描信用卡交易記錄，從中找到欺詐行為；90年代末，Google把這項技術用到了網絡搜索上。但在那個時候，機器學習還和普通

《機器學習實戰》知識點筆記目錄

body cnblogs 機器學習實戰 href post 目錄開始 classify 　　從今天起，開始學習《機器學習實戰》，並記錄學習到的知識點。　　　　　　　　　　　　-- 2017-12-31 1，第2章KNN算法筆記_函數classify0 《機器學

機器學習知識點查漏補缺（隨機森林和extraTrees）

efault 生成 xtra lac use sample strategy default lin 隨機森林對數據樣本及特征隨機抽取，進行多個決策樹訓練，防止過擬合，提高泛化能力一般隨機森林的特點： 1、有放回抽樣（所以生成每棵樹的時候，實際數據集會有重復），

機器學習知識點查漏補缺（支持向量機）

技巧條件 blog 更多 nbsp pos .com 最優化應該一、模型概念支持向量機的模型基本模型是建立在特征空間上的最大間隔線性分類器，通過使用核技巧，可以使它成為非線性分類器。當訓練數據線性可分時，通過硬間隔最大化，學習一個線性分類器，即線性可分支持向量

機器學習知識點查漏補缺（樸素貝葉斯分類）

平滑 http 運算貝葉斯公式 -s 目標 bubuko 思想指數一、基本模型樸素貝葉斯分類模型的基本思想就是貝葉斯公式，對以特征為條件的各類別的後驗概率。貝葉斯公式如下：對標樸素貝葉斯分類模型的公式如下：分子中的第二項為每個類別的概率（實際運算即頻

Python初始學習必要掌握知識點(5分鐘速學)

學習基礎程序員編程菜鳥 1、字符串 python中單引號和雙引號使用完全相同。使用三引號(‘‘‘或""")可以指定一個多行字符串。轉義符 ‘\‘ 反斜杠可以用來轉義，使用r可以讓反斜杠不發生轉義。。如 r"this is a line with \n" 則\n會顯示，並不是換行。

機器學習知識點01-監督學習

結果 you 組成都是直線擬合表示 idt 選擇分類問題從這篇隨筆開始是觀看斯坦福大學（吳恩達）機器學習課程，個人覺得課程講的非常棒，也很容易理解，特此總結知識點筆記。筆記如下：我們應用學習算法，可以在這

掌握Spark機器學習庫-01

c++ scala 強化學習聚類分享圖片 ron info 初識分享第1章初識機器學習在本章中將帶領大家概要了解什麽是機器學習、機器學習在當前有哪些典型應用、機器學習的核心思想、常用的框架有哪些，該如何進行選型等相關問題。 1-1 導學 1-2 機器學習概述

掌握Spark機器學習庫-02-mllib數據格式

style inf 向量 ima img 技術 spark 特點特征 MLlib 1.MLlib介紹 1）MLlib特點 2）哪些算法 3）閱讀官方文檔 MLlib提供了哪些：算法特征工程管道持久化 2.MLlib數據格式 1）本地向量 2）標簽數據 3）

掌握Spark機器學習庫-07.6-線性回歸實現房價預測

linear 線性 ack transform regress build count random () 數據集 house.csv 數據概覽代碼 package org.apache.spark.examples.examplesforml import org

機器學習-貝葉斯相關知識點

貝葉斯判定準則：為最小化總體風險，只需在每個樣本上選擇能使條件風險R(c|x)最小的類別標記： /-------------------------------極大似然估計---------------------------------/ 估計類的常用策略：先假定其具有某種

掌握Spark機器學習庫大資料開發技能更進一步

掌握Spark機器學習庫大資料開發技能更進一步第1章初識機器學習在本章中將帶領大家概要了解什麼是機器學習、機器學習在當前有哪些典型應用、機器學習的核心思想、常用的框架有哪些，該如何進行選型等相關問題。 1-1 導學 1-2 機器學習概述 1-

機器學習掌握知識點

一、人工智慧學習演算法分類

1. 純演算法類

2.建模方面

二、詳細演算法

1.分類演算法

2.迴歸演算法

3.聚類演算法

4.降維演算法

5.概率圖模型演算法

6.文字挖掘演算法

7.優化演算法

8.深度學習演算法

三、建模方面

1.模型優化·

2.資料預處理

相關推薦