機器學習 - 無監督學習-多元高斯模型

阿新 • • 發佈：2018-11-06

（一）異常檢測---基於高斯（正態）分佈

m個訓練樣本，每個樣本有n個features

即m個樣本的每個屬性集都呈現高斯分佈，因此有以下計算：

例子如下：

（二）評價異常檢測系統

將所有資料按照60%,20%,20%的比例分成三部分，分別為training set、cross validation set和test set.

例子如下：

評價既然採用召回率、準確率和F1值，同時，可以基於CV選擇一個合適的異常引數

（三）異常檢測和監督學習的區別

（1）異常檢測演算法具有少量的異常樣本和大量的正常樣本，而監督學習演算法有大量的positive和negative樣本。

（2）異常檢測有很多的異常型別，一般的演算法很難通過少量的異常樣本學習到多有的異常型別，而監督學習演算法有足量的正樣本和負樣本，能夠讓演算法學習到各個樣本的特徵。

（3）異常檢測中未來還可能出現許多新型別的異常。

（4）異常檢測演算法用於詐騙識別，工業零件問題檢測等，監督學習演算法用於垃圾郵件的分類，天氣預報和癌症檢測等

（四）異常檢測的引數選取

問題1：樣本資料的某些屬性可能不呈現高斯分佈

解決方案：通過數學變換（log,開根號，平方等）使之呈現高斯分佈。

問題2：如何選取有用的features

方法：觀察已有的屬性分佈，畫出高斯分佈圖形，觀察到有些異常樣本被正常樣本包圍，思考原因，這時，可以試著新增一個新的feature，這個新的feature能夠將異常樣本從正常樣本中區分開。對每個不能被區分的樣本進行同樣的思考，這樣就有了能夠將的所有異常樣本區分來的features.

一個例子，如當x1,x2,x,x4不能將異常的computers從一個data center中區分開時，可以試圖新增x5,x6屬性，使之區分開。新新增的屬性可以是已有屬性的數學組合。

（五）多元高斯分佈

將所有的features為軸定義為一個n為空間的高斯分佈，其中均值是一個1*n的矩陣，標差是一個n*n的矩陣。

一些例子如下：

（六）使用多元高斯分佈的異常檢測

1、均值和方差的選取：

2、多遠高斯分佈的異常檢測模型和一般高斯分佈的異常模型的使用區別

版權宣告：本文為博主原創文章，未經博主允許不得轉載。 https://blog.csdn.net/u011470552/article/details/54863529

機器學習 - 無監督學習-多元高斯模型

（一）異常檢測---基於高斯（正態）分佈 m個訓練樣本，每個樣本有n個features 即m個樣本的每個屬性集都呈現高斯分佈，因此有以下計算：例子如下：（二）評價異常檢測系統將所有資料按照60%,20%,20%的比例分成三部分

關於什麼時候用異常檢測和監督學習，以及多元高斯模型的使用

當有很多負樣本，少量正樣本的時候，用異常檢測。假如特徵不符合高斯分佈，則應該對原始特徵做一個變換，比如log(x)或者X^2等等讓其符合高斯分佈多元高斯混合模型公式：其中裡面有兩個引數一個是u特徵均值，一個是協方差矩陣混合高斯模型使用條件 m（訓練樣本數量）>n

Stanford機器學習-異常檢測和多元高斯分佈

一、異常檢測這章主要學習異常檢測問題，它是機器演算法的一個常見應用，同時也對於我們生活中的很多問題有很大的幫助，總的來說，它主要用於非監督的學習問題。那我們怎麼來理解異常檢測是一個怎麼樣的問題呢？我們來看一個相關的問題：飛機引擎的檢測。因為引擎對於飛機來說

吳恩達機器學習 - 無監督學習——K-means演算法吳恩達機器學習 - 無監督學習——K-means演算法

原吳恩達機器學習 - 無監督學習——K-means演算法 2018年06月25日 12:02:37 離殤灬孤狼閱讀數：181

機器學習--無監督學習之K-means聚類方法

一、引言從上次SVM之後幾節課講的是學習理論，這塊理論性比較深，我得好好消化一下。所以先總結一下第一個無監督的機器學習演算法，K-means聚類方法。所謂無監督學習，就是資料樣本沒有標籤，要讓學習演算法自己去發現數據之間內在的一些結構和規律。就好比做題沒有標準答案，所以

機器學習-->無監督學習-->聚類

本篇博文將詳細總結機器學習裡面的一個很重要的內容-聚類。聚類定義定義聚類就是對大量未知標註的資料集，按資料的內在相似性將資料集劃分為多個類別，使類別內的資料相似度較大而類別間的資料相似度較小。是無監督的分類方式。聚類思想給

機器學習----無監督學習演算法之異常檢測

問題2：如何選取有用的features 方法：觀察已有的屬性分佈，畫出高斯分佈圖形，觀察到有些異常樣本被正常樣本包圍，思考原因，這時，可以試著新增一個新的feature，這個新的feature能夠將異常樣本從正常樣本中區分開。對每個不能被區分的樣本進行同樣的思考，這樣就有了能夠將的所有異常樣本區分來的fea

[吳恩達機器學習筆記]15非監督學習異常檢測7-8使用多元高斯分布進行異常檢測

進行平均值 info 錯誤 blog 占用 ron 關系 http 15.異常檢測 Anomaly detection 覺得有用的話,歡迎一起討論相互學習~Follow Me 15.7-8 多變量高斯分布/使用多元高斯分布進行異常檢測 -Multivariate Gaus

[吳恩達機器學習筆記]15.1-3非監督學習異常檢測算法/高斯回回歸模型

閾值訓練集 jpg -a 情況 color 訓練 ase 需要 15.異常檢測 Anomaly detection 覺得有用的話,歡迎一起討論相互學習~Follow Me 15.1問題動機 Problem motivation 飛機引擎異常檢測假想你是一個飛機引擎制造

斯坦福大學機器學習筆記——異常檢測演算法（高斯分佈、多元高斯分佈、異常檢測演算法）

異常檢測問題介紹：異常檢測演算法主要用於無監督學習問題，但從某種角度看它又類似於一種有監督學習的問題，下面我們從一個例子中簡單介紹一下什麼是異常檢測問題。比如我們有一個飛機引擎製造商，對於一個新造出的飛機引擎我們想判斷這個引擎是不是異常的。假如我們有

非監督學習之混合高斯模型和EM演算法——Andrew Ng機器學習筆記（十）

0、內容提要這篇博文主要介紹： - 混合高斯模型（mixture of Gaussians model） - EM演算法（Expectation-Maximization algorithm） 1、引入假設給定一個訓練集{x(1),...,x(m)

機器學習-多元高斯分佈（異常檢測）

的系列文章進行學習。不過博主的部落格只寫到“第十講資料降維” http://blog.csdn.net/abcjennifer/article/details/8002329，後面還有三講，內容比較偏應用，分別是異常檢測、大資料機器學習、photo OCR。為了學習的完整性，我將把後續三講的內容補充