R筆記20181103基本統計分析
阿新 • • 發佈:2018-12-19
一、描述性統計分析
1、峰度與偏度 網上找了一些相關資料 2、aggregate()
aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)
將x
按by
分組後將FUN
作用於每一個子集上,其中by
是一個list,使用時要將組別轉化為list格式,
simplify
控制資料是否將結果簡化為向量或矩陣。
3、by
by(data, INDICES, FUN, ..., simplify = TRUE)
by
功能類似於aggregate
,但by
中FUN
可以返回多個值,而aggregate
中的FUN
只能是返回單值的函式
3、describe(){Hmisc}
stat.desc(){pastecs}
;describe(){psych}
一些描述性統計函式,功能類似於summary,返回一系列描述性統計值,具體詳見R語言實戰7.1
二、檢驗
chisq.test(x, y = NULL, correct = TRUE,p = rep(1/length(x), length(x)), rescale.p = FALSE,
simulate.p.value = FALSE, B = 2000)
x可以為一列聯表,進行卡方檢驗,也可以是x,y分別為需要檢驗的向量,檢驗他們是否獨立
一般p<0.5,認為它們不獨立
連結1(卡方檢驗)
連結2(卡方檢驗的應用)
2、