Hoeffding不等式

阿新 • • 發佈：2018-12-11

在看統計學習方法證明泛化誤差上界中提到使用Hoeffding不等式(霍夫丁不等式)

很陌生，佔個坑理解一下。

關於該不等式的原地址：Hoeffding's inequality

Hoeffding不等式指的是某個事件的真實概率與在伯努利試驗中觀察到的頻率之間的差異

考慮到伯努利實驗，該實驗是在同樣的條件下重複地、相互獨立地進行的一種隨機試驗，其特點是該隨機試驗只有兩種可能結果：發生或者不發生。比較熟悉的一種就是0-1分佈，也叫兩點分佈。

用H(n)表示拋n次硬幣正面向上的概率

則正面向上的次數不超過k的概率為

當k=(p-ε)n時，霍夫丁上界將會按照指數級變化，得到霍夫丁不等式

當k=(p+ε)n時

兩式合併，得到

令

得到

在《統計機器學習》中的Hoeffding的公式好像有很多的版本。

證明實在沒看懂，就依據例子簡單的瞭解一下吧。

不少部落格舉到一個從小罐中裡摸小球的例子，從一個裝有綠色和黃色的罐子裡隨機地摸出小球，根據摸出小球的概率來估計整個罐子中綠色球和黃色球的所佔的比例。

那麼當抽出的樣本數越多，最終預測出的綠球佔整個罐子中小球的概率u會越趨近於實際罐子中綠色小球佔整個罐子小球的概率v。

所以就有了霍夫丁不等式，在一個含有N個樣本數（N足夠大）的資料集中，在誤差允許的範圍內，u和v可以不斷地靠近。左側的概率隨著N的增大而減少，所以，要減少預測和實際之間的誤差，就要增大樣本數量。

附一張參考博文2裡的圖，不做多的解釋。

參考博文：

1、機器學習數學原理（8）——霍夫丁不等式對原英文文章的翻譯

2、[機器學習][2]--霍夫丁不等式

Hoeffding不等式

在看統計學習方法證明泛化誤差上界中提到使用Hoeffding不等式(霍夫丁不等式) 很陌生，佔個坑理解一下。關於該不等式的原地址：Hoeffding's inequality Hoeffding不等式指的是某個事件的真實概率與在伯努利試驗中觀察到的頻率之間的

Hoeffding不等式的證明

這個不等式是Azuma鞅不等式的一個推論，下面的證明不用複雜的理論。以後再補上隨機過程中的證明。從wikipedia摘抄的。注意，markov不等式中的y是x，不等式右邊的E(X) ,換成E(|X|)。證明過程假設X是非負隨機變數 Hoeffding不等式如下：對於任意

【機器學習基礎】理解為什麼機器可以學習——Hoeffding不等式

引入在上一小節“理解為什麼機器可以學習——PAC學習模型”中，我們主要討論了假設的錯誤率問題和如何說一個學習器是可學習的，並給出了PAC學習理論。這一小節，我們將沿著這個方向，討論一下，有限假設空間的樣本複雜度，並用Hoeffding不等式來界定概率邊界。假設空間的樣本

Hoeffding's inequality霍夫丁不等式

引入假定投硬幣，投出正面的概率為 p p p，反面的概率為 1−p 1

機器學習推導合集01-霍夫丁不等式的推導 Hoeffding Inequality

1.0 引言筆者第一次接觸霍夫丁不等式（Hoeffding Inequality）是在林軒田先生的機器學習基石課程（還是在b站上看的hh）上。可以說，當時沒有系統學過概率論與數理統計（probability and statistics）的我，對於不等式的推導是感到相當頭

霍夫丁不等式（Hoeffding's inequality）

1.簡述在概率論中，霍夫丁不等式給出了隨機變數的和與其期望值偏差的概率上限，該不等式被Wassily Hoeffding於1963年提出並證明。霍夫丁不等式是Azuma-Hoeffding不等式的特例，它比Sergei Bernstein於1923年證明

Hoeffding's inequality

oba cad val ref earch ons fyi them nat Let $\{Y_i: i\in J\}$ be zero mean independent complex-valued random variables satisfying $|Y_i|\l

5、不等式數列--百度2017春招

同類項需要 clas dex -s 數量 tmp 表示所有 [編程題] 不等式數列時間限制：1秒空間限制：32768K 度度熊最近對全排列特別感興趣,對於1到n的一個排列,度度熊發現可以在中間根據大小關系插入合適的大於和小於符號(即 ‘>‘ 和 ‘<‘

不等式數列 DP

tac %d question def des scanf 位置 using class 度度熊最近對全排列特別感興趣,對於1到n的一個排列,度度熊發現可以在中間根據大小關系插入合適的大於和小於符號(即 ‘>‘ 和 ‘<‘ )使其成為一個合法的不等式數列

四邊形不等式（石子合並）

石子合並 i+1 col 區間 sum style log n) sca 動態規區間dp做這道題的話應該是n^3，下面的代碼優化到了n^2，用四邊形不等式優化。設mid[i][j]是dp[i][j]的最優解的斷點，即它左區間的右端點，那麽mid[i][j-1]<

初等數學問題解答-7：分式不等式證明

等式成立解答 san 遞增高中數學 color 產品證明機器本題適合初三以上數學愛好者解答。問題：設 $x, y, z, a, b, c, r > 0$. 證明: $${x + y + a + b \over x+ y + a + b +

POJ 1160 Post Office (四邊形不等式優化DP)

open memset cpp 。。 ios ems max while ctype 題意: 給出m個村莊及其距離，給出n個郵局，要求怎麽建n個郵局使代價最小。析：一般的狀態方程很容易寫出，dp[i][j] = min{dp[i-1][k] + w[k+1][j]}，表示

四邊形不等式優化

ima sta c++ 矩陣連乘 href jpg 決策 image 也有聲明: 本文轉載自網易博客：　　　　http://blog.163.com/dqx_wl/blog/static/2396821452015111133052112/ 四邊形不等式優化_石子合並問

MT【16】利用柯西不等式求三角的最大值

技術分享 com style img 不等式 bsp nbsp png 均值評：此題也可以設$1+cos\theta=t$,平方後變成$t$的單變量利用均值去做. 柯西平衡系數法其實就是待定系數法，利用等號取到的條件。MT【16】利用柯西不等式求三角的最大值

MT【33】證明琴生不等式

border play blog display tle 分享 eight 單單 tco 解答：這裏數學歸納法證明時指出關鍵的變形.評:撇開琴生不等式自身的應用和意義外，單單就這個證明也是一道非常不錯的練習數學歸納法的經典題目。MT【33】證明琴生不等式

MT【97】三元基本不等式秒解一道三元不等式

es2017 技術 lin round 基本 com 技術分享 itl tle MT【97】三元基本不等式秒解一道三元不等式

BZOJ 2118 墨墨的不等式數論 + 最短路 + 計數

ace ret space log const 最短 fin push bzoj 1 #include<bits/stdc++.h> 2 #define LL long long 3 const LL INF = 50000000000000000ll;

數據處理不等式：Data Processing Inequality

ext right 工程 log src enter 可用 proc 互信我是在差分隱私下看到的，新解決方案的可用性肯定小於原有解決方案的可用性，也就是說信息的後續處理只會降低所擁有的信息量。那麽如果這麽說的話為什麽還要做特征工程呢，這是因為該不等式有一個巨大

【轉】斜率優化DP和四邊形不等式優化DP整理

dex add ive mat 整理 off code 斜率dp 好的當dp的狀態轉移方程dp[i]的狀態i需要從前面（0~i-1）個狀態找出最優子決策做轉移時我們常常需要雙重循環（一重循環跑狀態 i，一重循環跑 i 的所有子狀態）這樣的時間復雜度是O(N^2)而斜

石子合並問題（四邊形不等式DP優化）

區間dp 很多 bsp 不等式優化四邊形實現問題石子合並有很多種算法： 1，任意兩堆可以合並：貪心+單調隊列。 2，相鄰兩堆可合並：區間DP( O(n^3)) ）。 3，相鄰，四邊形不等式優化DP（O(n^2) ）。

Hoeffding不等式

相關推薦