R語言 quantile()和fivenum()的差別在於——加權平均與算術平均（轉載）

阿新 • • 發佈：2019-01-31

轉自：http://blog.sina.com.cn/s/blog_a184ae810102xqwe.html quantile()和fivenum()的本質差別在於,quantile()函式的演算法是採用加權平均，fivenum()是算術平均。這麼說可能不易理解，其實很簡單的，下面舉個例子說明就容易理解了。例如，一組資料 x <- 11 : 18,則如下圖，第一位是11，第二位是12，，，第8位是18，

對於quantile()演算法——加權平均， 0%位是第1位（1+（8-1）*0%=1），值為11； 25%位是第2.75位（1+（8-1）*25%=2.75），第2.75位介於第2位和第3位之間，距離哪位較近，哪位資料的權重較大，所以第3位資料的權重是0.75，第2位資料是權重是0.25，則25%位的值=13*0.75+12*0.25=12.75

；

同理，50%位是第4.5位（1+（8-1）*50%=4.5），值=14*0.5+15*0.5=14.5； 75%位是第6.25位（1+（8-1）*75%=6.25），值=16*0.75+17*0.25=16.25； 100%位是第8位（1+（8-1）*100%=8），值為18；對於fivenum()演算法——算術平均， 0%位是第1位（1+（8-1）*0%=1），值為11； 25%位是第2.75位（1+（8-1）*25%=2.75），第2.75位介於第2位和第3位之間，用算術平均法，則25%位的值=（13+12）/2=12.5；同理，50%位是第4.5位（1+（8-1）*50%=4.5），值=(14+15)/2=14.5

； 75%位是第6.25位（1+（8-1）*75%=6.25），值=(16+17)/2=16.5； 100%位是第8位（1+（8-1）*100%=8），值為18；用r語言驗證：

quantile()的程式碼

x <- 1:100
n <- length(x)
probs = seq(0, 1, 0.25)
index <- 1 + (n - 1) * probs
lo <- floor(index)
hi <- ceiling(index)
x <- sort(x, partial = unique(c(lo, hi)))
qs <- x[lo]
i <- which(index > lo)

h <- (index - lo)[i]
qs[i] <- (1 - h) * qs[i] + h * x[hi[i]]
qs
quantile(x=1:100)

fivenum()的程式碼

x <- 1:100
n <- length(x)
n4 <- floor((n + 3)/2)/2
d <- c(1, n4, (n + 1)/2, n + 1 - n4, n)
0.5 * (x[floor(d)] + x[ceiling(d)])
fivenum(x=1:100)

R語言 quantile()和fivenum()的差別在於——加權平均與算術平均（轉載）

R語言 quantile()和fivenum()的差別在於——加權平均與算術平均（轉載）

SQLServer中DataLength()和Len()兩內置函數的區別（轉載）

ps 和 grep 查找消除 grep自身查找（轉載）

在C#中，Json的序列化和反序列化的幾種方式總結（轉載）

複製中釋出伺服器和訂閱伺服器內容不一致的解決辦法（轉載）

R語言平均值和加權平均值

R 語言assign 和get 函式用法

R語言subset和merge函式的使用

【R語言資料分析】豆瓣電影R語言爬蟲和資料分析

C語言中存儲類別又分為四類：自動（auto）、靜態（static）、寄存器的（register）和外部的（extern）。

R語言：提取路徑中的文件名字符串（basename函數）

◮ R語言筆記(四): 向量、陣列、矩陣與資料框 + 利用矩陣求解二維線性方程組

[學習分享] R語言擴充套件包dplyr筆記（轉載）

【R語言】合併行操作中data.frame與data.table的效能比較

【R語言學習筆記】RGraphviz包的安裝與載入方法

二分類模型效能評價（R語言，logistic迴歸，ROC曲線，lift曲線，lorenz曲線）

Asp.net MVC使用FormsAuthentication，MVC和WEB API可以共享身份認證（轉載）

自然語言交流系統 phxnet團隊創新實訓個人博客（六）

自然語言交流系統 phxnet團隊創新實訓個人博客（十三）

Oracle學習筆記—Db_name、Db_domain、Global_name、Service_name、Instance_name和Oracle_SID（轉載）

R語言 quantile()和fivenum()的差別在於——加權平均與算術平均（轉載）

相關推薦