威爾遜置信區間

阿新 • • 發佈：2020-07-21

由於正態區間對於小樣本並不可靠，因而，1927年，美國數學家 Edwin Bidwell Wilson提出了一個修正公式，被稱為“威爾遜區間”，很好地解決了小樣本的準確性問題。

根據離散型隨機變數的均值和方差定義：
μ=E(X)=0*(1-p)+1*p=p
σ=D(X)=(0-E(X))2(1-p)+(1-E(X))2p=p2(1-p)+(1-p)2p=p2-p3+p3-2p2+p=p-p2=p(1-p)
因此上面的威爾遜區間公式可以簡寫成：

程式碼：

def wilson_score(pos, total, p_z=2.):
    """
    威爾遜得分計算函式
    參考：https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval
    :param pos: 正例數
    :param total: 總數
    :param p_z: 正太分佈的分位數
    :return: 威爾遜得分
    """
    pos_rat = pos * 1. / total * 1.  # 正例比率
    score = (pos_rat + (np.square(p_z) / (2. * total))
             - ((p_z / (2. * total)) * np.sqrt(4. * total * (1. - pos_rat) * pos_rat + np.square(p_z)))) / \
            (1. + np.square(p_z) / total)
    return score

　　SQL實現程式碼：

#wilson_score
SELECT widget_id, ((positive + 1.9208) / (positive + negative) - 
                   1.96 * SQRT((positive * negative) / (positive + negative) + 0.9604) / 
                          (positive + negative)) / (1 + 3.8416 / (positive + negative)) 
       AS ci_lower_bound FROM widgets WHERE positive + negative > 0 
       ORDER BY ci_lower_bound DESC;

#
SELECT widget_id, (positive - negative) 
       AS net_positive_ratings FROM widgets ORDER BY net_positive_ratings DESC;

#
SELECT widget_id, positive / (positive + negative) 
       AS average_rating FROM widgets ORDER BY average_rating DESC;

　　excel實現程式碼：

=IFERROR((([@[Up Votes]] + 1.9208) / ([@[Up Votes]] + [@[Down Votes]]) - 1.96 * 
    SQRT(([@[Up Votes]] *  [@[Down Votes]]) / ([@[Up Votes]] +  [@[Down Votes]]) + 0.9604) / 
    ([@[Up Votes]] +  [@[Down Votes]])) / (1 + 3.8416 / ([@[Up Votes]] +  [@[Down Votes]])),0)

星級評價排名

參考資料：

威爾遜區間(Wilson score interval)

如何不按平均評分排序

貝葉斯平均評分

用星級評定專案排名

威爾遜置信區間

各大定理及證明（裴蜀定理，威爾遜定理，費馬定理，擴充套件歐幾里得，尤拉定理，擴充套件尤拉定理，中國剩餘定理，擴充套件中國剩餘定理）

目錄同餘，整除模運算埃式篩法尤拉篩法最大公約數和最小公倍數輾轉相除法更相減損術裴蜀定理威爾遜定理費馬定理同餘等價類、剩餘系、縮系尤拉函式尤拉定理擴充套件尤拉定理區間逆元擴充套件歐幾里得中國剩餘定理擴充

【2019 Roar CTF】baby RSA + 威爾遜定理 + python寫指令碼小結

技術標籤：python機器學習awk程式語言os Baby RSA 題目內容： import sympy import random def myGetPrime():

雷蛇推出新美國隊長山姆·威爾遜主題Xbox手柄產品

今年3月，雷蛇宣佈將與漫威合作推出“新美國隊長”山姆·威爾遜主題Xbox手柄。這款手柄的設計基於山姆戰衣風格製作，充電底座採用美劇《獵鷹與冬兵》中的美隊盾牌設計。

威爾遜定理學習筆記

定理當且僅當 \\(p\\) 是質數時， \\((p-1)! \\equiv -1 \\pmod p\\) 。證明首先對於 \\(p < 5\\) 時，直接證即可。

Python 餘弦相似度與皮爾遜相關係數計算例項

夾角餘弦(Cosine) 也可以叫餘弦相似度。幾何中夾角餘弦可用來衡量兩個向量方向的差異，機器學習中借用這一概念來衡量樣本向量之間的差異。

Python求解正態分佈置信區間教程

正態分佈和置信區間正態分佈（Normal Distribution）又叫高斯分佈，是一種非常重要的概率分佈。其概率密度函式的數學表達如下：

正態分佈-置信區間計算

統計學有兩大主要分支，分別是描述性統計學和推斷統計學。描述性統計學用於描述和概括資料的特徵以及繪製各類統計圖表。總體資料，往往因為資料量太大而難以被獲取，所以就有了通過較小的樣本資料推測總體特性的推斷

拍下送杯勺，麥斯威爾原味/特濃三合一咖啡110條74.9元

拍下送杯勺，麥斯威爾原味/特濃三合一咖啡110條報價84.9元，限時限量10元券，實付74.9元包郵，領券併購買。

皮爾遜相關係數實現相似K線及其效能優化

https://blog.csdn.net/yuhk231/article/details/80810427 皮爾遜相關係數實現相似K線及其效能優化

Spark/Scala在推薦系統中實現相似度演算法(歐氏距離、皮爾遜相關係數、餘弦相似度:帶實現程式碼)

技術標籤：pythonpython 在推薦系統中，協同過濾演算法被廣泛使用，主要分為基於使用者和基於專案的協同過濾演算法。核心點基於“一個人”或者“一個物品”。根據這個人或者物品的屬性，比如性別、年齡、工作、收

統計科學之聊聊置信度與置信區間

今天這篇聊聊統計學裡面的置信度和置信區間。 1.點估計在講置信度和置信區間之前先講講點估計，那什麼是點估計呢？給你舉兩個例子你就知道了。

鮑威爾講話拉昇美股，對衝基金拋售逾 1 億股阿里巴巴股票

北京時間 2 月 25 日訊息，美聯儲主席鮑威爾稱美國或需要 3 年才能實現通脹目標，科技股拋售潮有所緩解，美股收高。截至收盤，道指漲 424.51 點，漲幅為 1.35%，報收 31961.86 點；標普 500 指數漲 44.06 點，漲幅為

臨期好價：麥斯威爾三合一速溶原味咖啡 100 條盒裝 69 元

臨期好價：麥斯威爾三合一速溶原味咖啡100條盒裝報價89元，限時限量20元券，實付69元包郵，領券併購買。

史克威爾艾尼克斯2021年度財報釋出銷售收入利潤小幅增長

5月13日今天，史克威爾艾尼克斯釋出了2021年度（2020年４月１日～2021年３月31日）財報，公司在疫情形勢嚴峻的一年中，實現了銷售收入以及利潤的小幅增長。

擊敗睏倦，麥斯威爾 3 合 1 速溶咖啡 100 條 65.91 元探底（送咖啡杯）

擊敗睏倦，麥斯威爾旗艦店 3 合 1 特濃速溶咖啡 100 條 517 吃貨節特惠價 89.9 元，下單立享 9 折，限時限量 15 元券，實付 65.91 元包郵，領券併購買。

史克威爾E3展示內容公佈新作以及《奇異人生重製版》等

史克威爾E3釋出會將於北京時間6月14日凌晨3點15分舉辦，時長約40分鐘，這場釋出會將帶來以下游戲資訊：

《怪物獵人崛起》利威爾兵長防具幻化參考

利威爾兵長是進擊的巨人中的一位超人氣角色，擁有眾多粉絲，那麼在《怪物獵人崛起》中能否幻化出利威爾兵長樣式的防具呢？現在為大家帶來“啤兒茶雙”分享的《怪物獵人崛起》利威爾兵長防具幻化參考，一起來看看吧。

美聯儲主席鮑威爾：央行數字貨幣報告預計於 9 月初發布

7 月 15 日訊息，據國外媒體報道，目前，圍繞央行數字貨幣（CBDC）的討論越來越激烈。

水乳二合一：傑威爾男士凝露 9.9 元新品衝量（京東 2 瓶 69.9 元）

【傑威爾化妝品旗艦店】傑威爾男士清潤海泉水活凝露（水乳 2 合 1）售價 59.9 元，今日可領 50 元券，實付 9.9 元包郵：天貓傑威爾男士保溼凝露 100ml 券後 9.9 元領 50 元券9.9 元活動隨時結束，這個價買來，隨便

威爾遜置信區間

相關推薦