1. 程式人生 > >用R進行統計學分析

用R進行統計學分析

1、基本統計

summary函式:R中的summary函式根據輸入的類提供輸入的摘要。該函式根據輸入物件的類呼叫各種函式。返回值也取決於輸入物件。例如,如果輸入是一個由數字資料組成的向量,它將為資料提供平均值、中值、最小值、最大值和四分位數,而如果輸入是表格(數字)資料,它將為每一列提供類似的計算。

cov:用來計算相關性,通過為函式中的方法引數指定apt值,我們可以計算不同型別的相關係數,即Pearson、Spearman、Kendall等。

data(iris)
summary(iris) 
mean(iris[,1]) 
sd(iris[,1])
cor(iris[,1],iris[,2])    #兩個向量之間的相關性
cor(iris[,1],iris[,3])
Cov.mat <- cov(iris[,1:4])
View(Cov.mat)

 

2、缺失值處理

對於大多數這些函式,我們有可能使用na.rm引數。這使使用者能夠處理丟失的資料。如果我們的資料中缺少值(在R中稱為NA),我們可以設定na.rm引數為真,計算只基於非na值。

a <- c(1:4, NA, 6)
mean(a) # returns NA,R不知道如何處理缺失值NA
mean(a, na.rm=TRUE)  #3.2