機器學習-累計分佈函式（CDF）

阿新 • • 發佈：2018-12-31

1.累計分佈函式（The Cumulative Distribution Function）:在x點左側事件發生的總和。

累計分佈函式的特性：

①因為累計分佈函式是計算x點左側的點的數量，所以累計分佈函式CDF是單調遞增的。

②CDF比沒有直方圖變化劇烈，但是CDF包含了相同的資訊，並且減少了噪聲。。

③由於CDF不存在裝箱（分段），因此比直方圖能更好的展現資料。

④所有的CDF中，在x趨近-∞時，CDF趨近於0，當x趨近+∞時，CDF趨近與1（100%）

⑤對於給定的資料集，CDF是唯一的

CDF可以看做直方圖的積分，直方圖可以看做是CDF對x的導數。

2 對比概率圖和特定分佈

通過直方圖/KDE和理論的密度函式對比是非常困難的，通過CDF進行對比是一個好點的選擇，但是也不是特別容易。

針對高斯分佈：

取反函式：

因此這個式子是斜率為σ並且截距是μ的一條直線。

針對垂直軸，採用原來資料的單位，針對水平軸x可以稱為概率單位（probits）。

需要生成一個概率圖，不但需要資料本身，還需要知道每一個點xi對應的分位點（quantile）yi。分位點取得方法如下：

①把資料進行升序排列

②分配每個資料的級別（rank），從1開始

③資料的分位點（quantile）yi定義為級別(rank)除以n+1，n是資料的總個數。

以下是例子：

機器學習-累計分佈函式（CDF）

1.累計分佈函式（The Cumulative Distribution Function）:在x點左側事件發生的總和。累計分佈函式的特性： ①因為累計分佈函式是計算x點左側的點的數量，所以累計分佈函式CDF是單調遞增的。 ②CDF比沒有直方圖變化劇烈，但是CDF

用累積分佈函式（CDF）計算期望

一般計算期望的方法為： E ( x

機器學習與深度學習系列連載：第二部分深度學習（八）可以自己學習的啟用函式（Maxout）

可以自己學習的啟用函式（Maxout）在深度學習中啟用函式有sigma， tanh， relu，還有以後會將到的selu，但是有沒有一個啟用函式不是人為設定的，是機器學出來的呢？對抗網路（GAN）之父Goodfellow，給我們一個肯定的答案。Learnabl

機器學習--支援向量機（六）徑向基核函式（RBF）詳解

前面講解了什麼是核函式，以及有效核函式的要求，到這裡基本上就結束了，很多部落格也是如此，但是呢這些只是理解支援向量機的原理，如何使用它講解的卻很少，尤其是如何選擇核函式更沒有人講，不講也是有原因的，因為核函式的選擇沒有統一的定論，這需要使用人根據不同場合或者不同問題選擇核函式

機器學習--支援向量機（五）核函式詳解

前面我們曾經引入二維資料的非線性的情況，但是那種非線性（並不是真正意義上的非線性）是通過鬆弛因子進行優化的，如果資料比之前還複雜怎麼辦呢？複雜到即使你怎麼調節C你都無法進行分類，這個時候怎麼辦？如下例子：這個無論你怎麼調節引數都無法在二維平面內進行線性分離了，但是

Python機器學習筆記：SVM（2）——SVM核函式

　　上一節我學習了完整的SVM過程，下面繼續對核函式進行詳細學習，具體的參考連結都在上一篇文章中，SVM四篇筆記連結為： Python機器學習筆記：SVM（1）——SVM概述 Python機器學習筆記：SVM（2）——SVM核函式 Python機器學習筆記：SVM（3）——證明SVM Python機器學習筆記

機器學習基本概念總結（轉載）

9.png png log images es2017 enter 08-18 機器學習 style 機器學習基本概念總結（轉載）

機器學習--近鄰成分分析（NCA）算法和度量學習

學習 tar 本質技術結果 font ear art component 1、近鄰成分分析（NCA）算法以上內容轉載自：http://blog.csdn.net/chlele0105/article/details/13006443 2、度量學習在機器學習中，

輕松入門機器學習之概念總結（二）

消息目的作者固定 erp 效率 dev 常用度量歡迎大家前往雲加社區，獲取更多騰訊海量技術實踐幹貨哦~ 作者：許敏接上篇：機器學習概念總結筆記（一） 8）邏輯回歸 logistic回歸又稱logistic回歸分析，是一種廣義的線性回歸分析模型，常用於數據挖掘

機器學習算法整理（二）邏輯回歸 python實現

alt bubuko 邏輯 style res n) regress com png 邏輯回歸(Logistic regression) 機器學習算法整理（二）邏輯回歸 python實現

機器學習算法整理（三）決策樹

outlook spa com width 選擇 clas .com img 衡量標準決策樹的訓練與測試如何切分特征（選擇節點）衡量標準-熵信息增益決策樹構造實例信息增益：表示特

ng機器學習視頻筆記（五） ——過擬合與正則化

哪些重復關註 osi 現實 regular 鏈接梯度下降簡單 ng機器學習視頻筆記（五） ——過擬合與正則化（轉載請附上本文鏈接——linhxx）一、過擬合和欠擬合 1、概念當針對樣本集和特征值，進行預測的時候，推導θ、梯度下降等，都在

ng機器學習視頻筆記（六） ——神經網絡基礎

一個變量視頻 img 輸入 center 內容 line 基礎 ng機器學習視頻筆記（六） ——神經網絡基礎（轉載請附上本文鏈接——linhxx）一、概述神經網絡，可以理解為輸入的內容，經過一系列的內部的處理，得到輸出的假設函數。簡單的神

ng機器學習視頻筆記（一）——線性回歸、代價函數、梯度下降基礎

info 而且 wid esc 二維 radi pan 圖形 clas ng機器學習視頻筆記（一） ——線性回歸、代價函數、梯度下降基礎（轉載請附上本文鏈接——linhxx）一、線性回歸線性回歸是監督學習中的重要算法，其主要目的在於用一個函數表

ng機器學習視頻筆記（二） ——梯度下降算法解釋以及求解θ

表示大於解釋圖片 bubuko eight 閾值自己極小值 ng機器學習視頻筆記（二） ——梯度下降算法解釋以及求解θ （轉載請附上本文鏈接——linhxx）一、解釋梯度算法梯度算法公式以及簡化的代價函數圖，如上圖所示。

ng機器學習視頻筆記（四） ——logistic回歸

微信 style 簡化關註 ora 微信公眾號預測縮放 log ng機器學習視頻筆記（四） ——logistic回歸（轉載請附上本文鏈接——linhxx）一、概述 1、基本概念 logistic回歸（logistic regression）

機器學習算法整理（六）— 貝葉斯算法_拼寫糾正實例_垃圾郵件過濾實例

mage width 分享整理 font .com size 圖片 span （p(h): 先驗概率）垃圾郵箱過濾實例機器學習算法整理（六）— 貝葉斯算法_拼寫糾正實例_垃圾郵件過濾實例

機器學習算法整理（六）— 貝葉斯算法_實現垃圾郵件過濾

image 實現 info mage 郵件技術機器 eight 實例垃圾郵件過濾實例機器學習算法整理（六）— 貝葉斯算法_實現垃圾郵件過濾

機器學習之數學基礎（一）-微積分，概率論和矩陣

系列學習 python 機器學習自然語言處理圖片 clas 數學基礎記錄學習python快一年了，因為之前學習python全棧時，沒有記錄學習筆記想回顧發現沒有好的記錄，目前主攻python自然語言處理方面，把每天的學習記錄記錄下來，以供以後查看，和交流分享。~~

機器學習算法整理（七）支持向量機

技術分享分享 bubuko wid width tro 技術 16px ID 容錯能力越強越好 b為平面的偏正向，w為平面的法向量，x到平面的映射：先求的是，距分界線距離最小的點；然後再求的是什麽樣的w和b，使得這樣的點，距離分界線的值最大。放縮之

機器學習-累計分佈函式（CDF）

相關推薦