R中利用apply、tapply、lapply、sapply、mapply、table等函數進行分組統計--轉載
阿新 • • 發佈:2017-12-23
tor ant 變換 true post 1.0 指定 ntile lec
apply()
apply(m,dimcode,f,fargs)
- m 是一個矩陣。
- dimcode是維度編號,取1則為對行應用函數,取2則為對列運用函數。
- f是函數
- fargs是f的可選參數集
> z <- matrix(1:6, nrow = 3)
> f <- function(x) {
+ x/c(2, 8)
+ }
> apply(z,1,f) #f函數得到兩個元素,則為幾行,豎著來的
[,1] [,2] [,3]
[1,] 0.5 1.000 1.50
[2,] 0.5 0.625 0.75
lapply()
lapply()(代表list apply)與矩陣的apply()函數的用法類似, 對列表的每個組件執行給定的函數,並返回另一個列表。
> x <- list(a = 1:10, beta = exp(-3:3), logic = c(TRUE,FALSE,FALSE,TRUE))
> lapply(x, mean)
$a
[1] 5.5
$beta
[1] 4.535125
$logic
[1] 0.5
sapply()
sapply()(代表simplified [l]apply)可以將結果整理以向量,矩陣,列表 的形式輸出。
> sapply(x, mean)
a beta logic
5.500000 4.535125 0.500000
> sapply(x, quantile) #每一個對應組件輸出5個元素,所以為5行,像矩陣一樣,豎著來的。
a beta logic
0% 1.00 0.04978707 0.0
25% 3.25 0.25160736 0.0
50% 5.50 1.00000000 0.5
75% 7.75 5.05366896 1.0
100% 10.00 20.08553692 1.0
> sapply(2:4, seq)
[[1]]
[1] 1 2
[[2]]
[1] 1 2 3
[[3]]
[1] 1 2 3 4
vapply()
vapply()與sapply()相似,他可以預先指定的返回值類型。使得得到的結果更加安全。
> vapply(x, quantile, c(1,2,5,6,8)) #它需要一個5個長度的向量來告訴他返回的類型,向量裏面的內容可以變換
a beta logic
0% 1.00 0.04978707 0.0
25% 3.25 0.25160736 0.0
50% 5.50 1.00000000 0.5
75% 7.75 5.05366896 1.0
100% 10.00 20.08553692 1.0
tapply( )
tapply(x,f,g)需要向量 x (x不可以是數據框),因子或因子列表 f 以及函數 g 。
tapply()執行的操作是:暫時將x分組,每組對應一個因子水平,得到x的子向量,然後這些子向量應用函數 g
> a <- c(24,25,36,37)
> b <- c(‘q‘, ‘w‘, ‘q‘,‘w‘)
> tapply(a, b, mean)
q w
30 31
R中利用apply、tapply、lapply、sapply、mapply、table等函數進行分組統計--轉載