1. 程式人生 > >R語言中描述統計量的多種方法summary()、describe()、str()等

R語言中描述統計量的多種方法summary()、describe()、str()等

1. summary()函式可以獲取描述性統計量

可以提供最小值、最大值、四分位數和數值型變數的均值,以及因子向量和邏輯型向量的頻數統計

2. misc包中的describe()函式

可返回變數和觀測的數量、缺失值和唯一值的數目、平均值、分位數,以及五個最大的值和五個最小的值

3.psych包中的describe()函式

psych包也擁有一個名為describe()的函式,它可以計算非缺失值的數量、平均數、標準差、中位數、截尾均值、絕對中位差、最小值、最大值、值域、偏度、峰度和平均值的標準誤

4.pastecs包中的stat.desc()的函式

可以計算種類繁多的描述性統計量。使用格式為:stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)


其中的x是一個數據框或時間序列。若basic=TRUE(預設值),則計算其中所有值、空值、缺失值的數量,以及最小值、最大值、值域,還有總和。若desc=TRUE(同樣也是預設值),則計算中位數、平均數、平均數的標準誤、平均數置信度為95%的置信區間、方差、標準差以及變異係數。最後,若norm=TRUE(不是預設的),則返回正態分佈統計量,包括偏度和峰度(以及它們的統計顯著程度)和Shapiro–Wilk正態檢驗結果

5.str()函式

以簡潔的方式顯示物件的資料結構及內容,可以檢視資料框中每個變數的屬性

6. attributes()函式

可以提取物件除長度和模式以外的各種屬性

##以上是為整體的資料計算描述性統計量,下面關注各組的描述性統計資訊

7.aggregate()函式

僅允許在每次呼叫中使用平均數、標準差這樣的單返回值函式,它無法一次返回若干個統計量

8.by()函式

格式為:by(data,INDICES,FUN),其中data是一個數據框或矩陣,INDICES是一個因子或因子組成的列表,定義了分組,FUN是任意函式。

9.doBy包中的summaryBy()函式

10.psych包中的describe.by()函式

#總結待補充