R語言中描述統計量的多種方法summary()、describe()、str()等

阿新 • • 發佈：2019-01-02

1. summary()函式可以獲取描述性統計量

可以提供最小值、最大值、四分位數和數值型變數的均值，以及因子向量和邏輯型向量的頻數統計

2. misc包中的describe()函式

可返回變數和觀測的數量、缺失值和唯一值的數目、平均值、分位數，以及五個最大的值和五個最小的值

3.psych包中的describe()函式

psych包也擁有一個名為describe()的函式，它可以計算非缺失值的數量、平均數、標準差、中位數、截尾均值、絕對中位差、最小值、最大值、值域、偏度、峰度和平均值的標準誤

4.pastecs包中的stat.desc()的函式

可以計算種類繁多的描述性統計量。使用格式為：stat.desc（x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95）

其中的x是一個數據框或時間序列。若basic=TRUE（預設值），則計算其中所有值、空值、缺失值的數量，以及最小值、最大值、值域，還有總和。若desc=TRUE（同樣也是預設值），則計算中位數、平均數、平均數的標準誤、平均數置信度為95%的置信區間、方差、標準差以及變異係數。最後，若norm=TRUE（不是預設的），則返回正態分佈統計量，包括偏度和峰度（以及它們的統計顯著程度）和Shapiro–Wilk正態檢驗結果

5.str()函式

以簡潔的方式顯示物件的資料結構及內容，可以檢視資料框中每個變數的屬性

6. attributes()函式

可以提取物件除長度和模式以外的各種屬性

##以上是為整體的資料計算描述性統計量，下面關注各組的描述性統計資訊

7.aggregate()函式

僅允許在每次呼叫中使用平均數、標準差這樣的單返回值函式，它無法一次返回若干個統計量

8.by()函式

格式為：by(data,INDICES,FUN)，其中data是一個數據框或矩陣，INDICES是一個因子或因子組成的列表，定義了分組，FUN是任意函式。

9.doBy包中的summaryBy()函式

10.psych包中的describe.by()函式

#總結待補充

R語言中描述統計量的多種方法summary()、describe()、str()等

R語言中描述統計量的多種方法summary()、describe()、str()等

R語言：常用統計一些方法代碼

R語言中的概率論和數理統計

R語言：常用統計檢驗方法

R語言中如何使用最小二乘法

JAVA語言中的變量

【譯文】怎樣在R語言中使用SQL命令

R語言實戰 - 基本統計分析（1）- 描述性統計分析

R語言中常用包（二）

003_go語言中的變量

r語言中如何進行兩組獨立樣本秩和檢驗

r語言中如何進行兩組獨立樣本秩和檢驗2

Go語言中的變量

在R語言中建立、使用資料框

R語言中的遺傳演算法詳細解析

R語言中的資料結構

C語言中結構體的訪問方法解讀

R語言錯誤資訊及相關解決方法

R語言中給重複的列賦予rank，123，12，1等。程式碼分享

Go語言中需要注意結構體方法副本傳參與指標傳參的區別

R語言中描述統計量的多種方法summary()、describe()、str()等

相關推薦