用R進行統計學分析
阿新 • • 發佈:2018-12-30
1、基本統計
summary函式:R中的summary函式根據輸入的類提供輸入的摘要。該函式根據輸入物件的類呼叫各種函式。返回值也取決於輸入物件。例如,如果輸入是一個由數字資料組成的向量,它將為資料提供平均值、中值、最小值、最大值和四分位數,而如果輸入是表格(數字)資料,它將為每一列提供類似的計算。
cov:用來計算相關性,通過為函式中的方法引數指定apt值,我們可以計算不同型別的相關係數,即Pearson、Spearman、Kendall等。
data(iris) summary(iris) mean(iris[,1]) sd(iris[,1]) cor(iris[,1],iris[,2]) #兩個向量之間的相關性 cor(iris[,1],iris[,3]) Cov.mat <- cov(iris[,1:4]) View(Cov.mat)
2、缺失值處理
對於大多數這些函式,我們有可能使用na.rm引數。這使使用者能夠處理丟失的資料。如果我們的資料中缺少值(在R中稱為NA),我們可以設定na.rm引數為真,計算只基於非na值。
a <- c(1:4, NA, 6) mean(a) # returns NA,R不知道如何處理缺失值NA mean(a, na.rm=TRUE) #3.2