深度學習-概率論與資訊理論基礎

阿新 • • 發佈：2018-12-11

來自《深度學習》的配套資料！！！詳情可以看書上的知識或是看相關的教材
非同步社群：深度學習

概率與資訊理論

概率論是用來描述不確定性的數學工具，很多機器學習算都是通過描述樣本的概率相關資訊來推斷或構建模型；資訊理論最初是研究如何量化一個訊號中包含資訊的多少，在機器學習中通常利用資訊理論的一些概念和結論描述不同概率分佈之間的關係。

1. 基本概念

隨機變數: 可以隨機取不同值的變數，在機器學習演算法中，每個樣本的特徵取值，標籤值都可以看作是一個隨機變數，包括離散型隨機變數和連續型隨機變數。
概率分佈: 表示隨機變數在每一個可能取到狀態下的可能性大小，對於離散型的概率分佈，稱為概率質量函式(Probability Mass Function, PMF)，對於連續性的變數，其概率分佈叫做概率密度函式(Probability Density Function, PDF)。
聯合概率分佈:　兩個或兩個以上隨機隨機變數聯合地概率分佈情況。
邊緣概率: 在知道聯合概率分佈後，其中某幾個變數子集的概率分佈被稱為邊緣概率分佈。
條件概率: 在給定某個事件後，其他事件發生的概率，例如在已知今天多雲的條件下下雨的概率就是條件概率有，在隨機變數 $X=x$ 的條件下 $Y=y$ 的條件概率為 $P(Y=y \| X=x) = \frac{P(Y=y,X=x)}{P(X=x)}$ 。
相互獨立: 如果 $\forall x \in X, y \in Y, P (X = x, Y = y) = P (X = x) P$

(Y=y)\forall x \in X, y \in Y, P(X=x,Y=y) = P(X=x)P(Y=y) $\forall x \in X, y \in Y, P (X = x, Y = y) = P (X = x) P (Y = y)$ ，那麼就稱隨機變數Ｘ和Ｙ是相互獨立的。
條件獨立: 如果 $\forall x \in X, y \in Y, z \in Z, P(X=x,Y=y \| Z=z) = P(X=x \| Z=z)P(Y=y \| Z=z)$ ，那麼就稱隨機變數Ｘ和Ｙ是關於Ｚ相互獨立的。
貝葉斯準則: 在已知 $P(y \| x)$ 和 $P(x)$ 的情況下， $P(x \| y)＝\frac{P(x)P(y \| x)}{P(y)}$ ，貝葉斯準則經常被用在已知引數的先驗分佈情況下求後驗分佈。
期望: 函式 $f(x)$ 在某個分佈 $P(x)$ 下的平均表現情況，記為 $E_{x \sim P}[f(x)]=\int{p(x)f(x)dx}$ 。
方差: 函式 $f(x)$ 在某個分不下表現的差異性，記為 $Var(f(x)=E[(f(x)-E[f(x)])^2]$ 。
協方差: 兩個變數之間線性相關的強度，記為 $Cov(f(x),g(x))= E[(f(x)-E[f(x)])(g(x)-E(g(x)))]$ 。
資訊熵: 描述某個概率分佈中不確定性的度量，記為 $H(x)= -E_{x \sim P}[\log P(x)]$ 。
交叉熵: 描述兩個概率分佈之間相似度的一個指標，在機器學習中經常使用交叉熵作為分類任務的損失函式，記為 $H(P,Q)=-E_{x \sim P}[\log Q(x)]$ 。

2. 常用概率分佈

伯努利分佈(Bernoulli distribution): 單個二值型變數的分佈，例如 $P(x=1)=p,P(x=0)=1-p$ 。
Multinoulli分佈: 包含k個取值的離散分佈，是伯努利分佈的擴充套件。
高斯分佈/正態分佈(Normal/Gaussian distribution): 自然狀態下最常見的分佈，概率密度函式為 $N(x;\mu,\sigma^2)= \sqrt{\frac{1}{2\pi \sigma^2}} \exp \left ( -\frac{1}{2\sigma^2} (x-\mu)^2 \right)$ ，形狀如下圖：
拉普拉斯分佈(Laplace distribution)：有著與高斯分佈很相近的形式，概率密度函式為 $\text{Laplace}(x; \mu, \gamma) = \frac{1}{2\gamma} \exp \left( -\frac{\| x-\mu \|}{\gamma} \right)$ $，形狀如下圖：

在這裡插入圖片描述

3. 一些常用函式

Logistic sigmoid函式（很重要的一個函式）
- $\sigma(x) = \frac{1}{1+\exp(-x)}$
- 函式影象
- logistic函式有許多重要的性質，通常被用來對數值進行平滑，下面是它的部分性質
線性整流函式(Rectified Linear Unit, ReLU)
- $ReLU(x) = max(0,x)$
- 目前神經網路中最常用的一種非線性啟用函式
Softplus函式
- $\zeta(x) = \log(1+\exp(x))$
- softplus函式可以看作是 $max(0,x)$ 的一個平滑，他與ReLU的函式影象如下
- 它有如下性質

4．結構化概率模型

概率圖模型: 通過圖的概念來表示隨機變數之間的概率依賴關係，下圖即為一個關於變數 $a,b,c,d,e$ 之間的有向圖模型，通過該圖可以計算 $p(a,b,c,d,e)=p(a)p(b \| a)p(c \| a,b)p(d \| b)p(e \| c)$

在這裡插入圖片描述

深度學習-概率論與資訊理論基礎

來自《深度學習》的配套資料！！！詳情可以看書上的知識或是看相關的教材非同步社群：深度學習概率與資訊理論概率論是用來描述不確定性的數學工具，很多機器學習算都是通過描述樣本的概率相關資訊來推斷或構建模型；資訊理論最初是研究如何量化一個訊號中包含資訊的多少，

總結CNN的發展歷程，以及一些卷積操作的變形，附帶基礎的深度學習知識與公式

1.Lenet-5 ：最先出現的卷積神經網路，1998年，由於當時的硬體還不成熟，因此到了2012年出現了AlexNet 2.AlexNet：可以說是現在卷積神經網路的雛形 3.VGGNet：五個模組的卷積疊加，網路結構如下： 4.GoogleNet：ince

深度學習(DL)與卷積神經網路(CNN)學習筆記隨筆-01-CNN基礎知識點

神經認知機。　卷積神經網路是受生物靈感的多層感知機的變體。從Hubel和Wiesel的早期對貓的視覺皮層的研究工作中得出，視覺皮層包含一組複雜的細胞排列。這些細胞會對很小的子區域敏感，稱作

深度學習——數學與機器學習基礎

線性代數標量：一個單獨的數向量：一個向量是一列數矩陣：一個矩陣是一個二維陣列張量：一個數組中的元素分佈在若干維座標的規則網格中，稱之為張量。比如張量A中座標為(i,j,k)的元素記作Ai,j,k。在計算機視覺中，5張3通道的32×32大小的影象可以用

CP1934-麥子深度學習深入與強化

ade ima 入門自己 rip loaded ans tar 我們麥子深度學習第三階段深入與強化隨筆背景：在很多時候，很多入門不久的朋友都會問我：我是從其他語言轉到程序開發的，有沒有一些基礎性的資料給我們學習學習呢，你的框架感覺一下太大了，希望有個循序漸進的教程或者

基於深度學習分析與檢索海量短視訊內容

在RTC 2018 實時網際網路大會上，美圖雲視覺技術總監趙麗麗分享了美圖在短視訊領域的AI技術應用，內容主要包括三部分：美圖短視訊的業務場景，基於此業務場景所做的短視訊內容分析和檢索技術，以及遇到的問題與相應的解決方案。最後是平臺構建過程中的一些思考。以下是演講內容整理。美圖在短視訊領域的代表產品就

分享《深度學習、優化與識別》PDF+《深度學習原理與TensorFlow實踐》PDF

.com log follow image http 51cto 分享 mage orf 下載：https://pan.baidu.com/s/1UNf3PmOtXCBCxx1eUprSzw 更多資料分享：http://blog.51cto.com/3215120 《深度學

分享《深度學習、優化與識別》PDF+《深度學習原理與TensorFlow實踐》PDF+焦李成

water http mage 深度 51cto proc orf ESS pwc 下載：https://pan.baidu.com/s/1xj7GymClcExjn48rPwCowQ 更多資料分享：http://blog.51cto.com/14087171 《深度學習、

Hands-on Machine Learning with Scikit-Learn and TensorFlow（中文版）和深度學習原理與TensorFlow實踐-學習筆記

監督學習：新增標籤。學習的目標是求出輸入與輸出之間的關係函式y=f(x)。樸素貝葉斯、邏輯迴歸和神經網路等都屬於監督學習的方法。監督學習主要解決兩類核心問題，即迴歸和分類。迴歸和分類的區別在於強調一個是連續的，一個是離散的。非監督學習：不新增標籤。學習目標是為了探索樣本資料之間是否

深度學習原理與實踐(開源圖書)-總目錄

深度學習原理與實踐(開源圖書)-總目錄 CSDN專欄: 深度學習原理與實踐(開源圖書) CSDN專欄: 機器學習原理與實踐(開源圖書) 深度學習理論的突破和深度學習硬體加速能力的突破，使AI在模式識別、無人駕駛、智力遊戲領域取得空前的成功。學術界和工業界全力以赴掀起

深度學習原理與TensorFlow實踐1：以分類問題入門Tensorflow

一、問題描述 Titanic問題（具體問題可檢視Kaggle平臺）根據已有資料預測每位乘客是否倖存。共包含12個欄位（或特徵）。二、看做分類問題處理解決方案 1. 資料讀入及預處理（pandas、scikit-learn） *pandas可以讀入各種型別的資料

深度學習word2vec筆記之基礎篇演算法篇應用篇--寫的非常到位

深度學習word2vec筆記之應用篇宣告： 1）該博文是Google專家以及多位博主所無私奉獻的論文資料整理的。具體引用的資料請看參考文獻。具體的版本宣告也參考原文獻 2）本文僅供學術交流，非商用。所以每一部分具體的參考資料並沒有詳細對應，更有些部分本來就

【深度學習】深度學習分類與模型評估

內容大綱分類和迴歸之外的機器學習形式評估機器學習模型的規範流程為深度學習準備資料特徵工程解決過擬合問題處理機器學習問題的通用流程監督學習的主要種類及其變種主要包括兩大類問題：分類迴歸

深度學習word2vec筆記之基礎篇

宣告： 1）該博文是多位博主以及多位文件資料的主人所無私奉獻的論文資料整理的。具體引用的資料請看參考文獻。具體的版本宣告也參考原文獻2）本文僅供學術交流，非商用。所以每一部分具體的參考資料並沒有詳細對應，更有些部分本來就是直接從其他部落格複製過來的。如果某部分不小心

關於舉辦“深度學習理論與實戰及GPU高效能運算解決方案應用” 高階培訓班的通知

關於舉辦“深度學習理論與實戰及GPU高效能運算解決方案應用”高階培訓班的通知各有關學校：隨著人工智慧（AI）特別是深度學習（Deep Learning）近年來的飛速發展，在多個領域的成功應用，已經成為當前學術界和各行業最炙手可熱的研究應用方向。不僅廣泛應用於搜尋引擎、電子商務

搞深度學習需掌握的基礎數學知識

IT 網際網路行業有個有趣現象，玩資本的人、玩產品的人、玩技術的人都能很好的在這個行業找到自己的位置並取得成功，而且可以只懂其中一樣，不需要懂其餘兩樣。玩技術的人是裡面最難做的，也是三者收益最低的，永遠都要不停學習，不停把畫餅變成煎餅。在今年 5

專訪 | 楊強教授談CCAI、深度學習泡沫與人工智慧入門

7 月 22 - 23 日，由中國人工智慧學會、阿里巴巴集團 & 螞蟻金服主辦，CSDN、中國科學院自動化研究所承辦的第三屆中國人工智慧大會（CCAI 2017）將在杭州國際會議中心盛大開幕。作為大會主席，香港科技大學計算機與工程系主任、AAAI Fel

概率與資訊理論基礎

1.前言幾乎所有的活動都需要能夠在不確定性存在時進行推理，除了數學的定理外，很難確定某個命題是真的。不確定性有三種可能： 1.被建模系統內在的隨機性。亞原子粒子的動力學描述為概率性的。 2.不完全檢測。不能觀測到所有驅動系統行為的變數，從三張圖片中選

深度學習(DL)與卷積神經網路(CNN)學習筆記隨筆-03-基於Python的LeNet之LR

　　0階張量叫標量(scarlar)；1階張量叫向量(vector)；2階張量叫矩陣(matrix) 　　　　本文主要內容：如何用python中的theano包實現最基礎的分類器–LR(Logistic Regression)。　　一、模型

深度學習-概率論與資訊理論基礎

概率與資訊理論

1. 基本概念

2. 常用概率分佈

3. 一些常用函式

4．結構化概率模型

相關推薦