R語言中描述統計量的多種方法summary()、describe()、str()等
阿新 • • 發佈:2019-01-02
1. summary()函式可以獲取描述性統計量
可以提供最小值、最大值、四分位數和數值型變數的均值,以及因子向量和邏輯型向量的頻數統計
2. misc包中的describe()函式
可返回變數和觀測的數量、缺失值和唯一值的數目、平均值、分位數,以及五個最大的值和五個最小的值
3.psych包中的describe()函式
psych包也擁有一個名為describe()的函式,它可以計算非缺失值的數量、平均數、標準差、中位數、截尾均值、絕對中位差、最小值、最大值、值域、偏度、峰度和平均值的標準誤
4.pastecs包中的stat.desc()的函式
可以計算種類繁多的描述性統計量。使用格式為:stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)
其中的x是一個數據框或時間序列。若basic=TRUE(預設值),則計算其中所有值、空值、缺失值的數量,以及最小值、最大值、值域,還有總和。若desc=TRUE(同樣也是預設值),則計算中位數、平均數、平均數的標準誤、平均數置信度為95%的置信區間、方差、標準差以及變異係數。最後,若norm=TRUE(不是預設的),則返回正態分佈統計量,包括偏度和峰度(以及它們的統計顯著程度)和Shapiro–Wilk正態檢驗結果
5.str()函式
以簡潔的方式顯示物件的資料結構及內容,可以檢視資料框中每個變數的屬性
6. attributes()函式
可以提取物件除長度和模式以外的各種屬性
##以上是為整體的資料計算描述性統計量,下面關注各組的描述性統計資訊
7.aggregate()函式
僅允許在每次呼叫中使用平均數、標準差這樣的單返回值函式,它無法一次返回若干個統計量
8.by()函式
格式為:by(data,INDICES,FUN),其中data是一個數據框或矩陣,INDICES是一個因子或因子組成的列表,定義了分組,FUN是任意函式。
9.doBy包中的summaryBy()函式
10.psych包中的describe.by()函式
#總結待補充