R: 矩陣運算及常用函式 II

阿新 • • 發佈：2019-01-15

aggregate也是跟SAC有關係的一個函式(stats包中)：先將物件分解為不同的組別(回憶一下split函式)，然後分個處理，最後合併顯示。具體地說，aggregate()函式將資料集(依據指定方法)拆分成不同子集，分別計算各自的統計資料，並(組合)返回計算結果。此函式一般對三種物件做處理：data.frame, formula 和 ts (即時間序列). 參考EXCEL的話，pivot table可以實現同樣的效果。 -+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+-

1. for class "data.frame": aggregate(x, by, FUN, ..., simplify = TRUE) 引數：

by: 分組依據。
- 必須是一組list格式的資料，list中的每個元素都要跟data frame中的observation數量相當；
- 每個元素可以是外部資料，也可以是x中自身的資料；
- 其中每個elements都會被轉換成factors的格式；
- 可在引數中直接對這組資料進行命名: by = list(Name1 = data serie1, Name2 = data serie2, ...)
FUN: 統計值的計算方法。
simplify: 如果為TRUE，返回向量或者矩陣(如果統計結果長度一致)，否則返回list。

example 1.1: 呼叫R資料庫: state.x77; state.region，以state.region為分組規則計算各組的均值 > aggregate(state.x77, list(Region = state.region), mean)

example 1.2: 呼叫R資料庫: state.x77; state.region，以state.region和變數Frost為分組規則計算各組的均值

> aggregate(state.x77, + list(Region = state.region,
+ Cold = state.x77[,"Frost"] > 130),

+ mean)

--------------------------------------------------------------------------------- 2. for class "formula": aggregate(formula, data, FUN, ..., subset, na.action = na.omit) 引數：

formula & data: 資料集及以此資料集構建的方程。
- formula的形式可以是one ~ one, one ~ many, many ~ one, 以及 many ~ many
- formula的形式也可以是 .~one, .~many, one~. 和 many~.
- formula右側為分組規則，左側為將要用FUN來計算的資料
subset: 非必須變數，可用於指定需要使用的data的子集。
na.action: 如何處理缺失值，預設為忽略NA。如果不選擇na.omit，則需指定函式去處理NA。
經常與xtabs()函式結合使用，其將aggregate的結果變成contingency table

example 2.1: one~one

> aggregate(weight ~ feed, data = chickwts, mean)

example 2.2: one ~ many > aggregate(breaks ~ wool + tension, data = warpbreaks, mean)

example 2.3: many ~ one

> aggregate(cbind(Ozone, Temp) ~ Month, data = airquality, mean)

example 2.4: many ~ many

> aggregate(cbind(ncases, ncontrols) ~ alcgp + tobgp, data = esoph, sum)

example 2.5: one ~ . and xtabs()

> ag <- aggregate(len ~ ., data = ToothGrowth, mean) > xtabs(len ~ ., data = ag)

--------------------------------------------------------------------------------- 3. for class "ts" (以下公式已經做了簡化處理):

aggregate(x, nfrequency = 1, FUN = sum, ...)

引數：

nfrequency: (輸出結果中)每個單位時間的observation的數量，必須能夠整除x的observation的總數

example 3.1: 計算美國總統每年的平均支援率(以及weighted的支援率)。可以自己嘗試去比較nfrequency變化後輸出結果的變化。

> aggregate(presidents, nfrequency = 1, FUN = mean)

> aggregate(presidents, nfrequency = 1, + FUN = weighted.mean, w = c(1, 1, 0.5, 1))

-+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+- aggregate的功能，也可以通過split+*apply函式實現。以example 1.1為例：

> state <- as.data.frame(state.x77) # state.x77 is a matrice > gr.state <- split(state, state.region) > t(sapply(gr.state, colMeans))

-+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+- aggregate函式的處理方法就是以某種規則將資料分組以後，對各組同時進行相同的統計計算。如果以上無法理解，不妨試著使用一下Excel中的PivotTable功能，類比一下就能弄懂此處aggregate的計算和輸出的邏輯。

R: 矩陣運算及常用函式 II

R: 矩陣運算及常用函式 II

R: 矩陣運算及常用函式 III

R: 矩陣運算及常用函式 V

R: 矩陣運算及常用函式 I

Cris 的 Python 資料分析筆記 03：NumPy 矩陣運算和常用函式（重點）

數字訊號處理專題（2）——利用FPGA進行基本運算及特殊函式定點運算

SQL語法及常用函式

MySQL中的聚合函式及常用函式

C++ 連結串列棧及常用函式實現

python的numpy庫中的矩陣陣列的常用函式

R語言中的常用函式

Python學習筆記 —— 字串及常用函式

Oracle之單表查詢及常用函式

ffmpeg八大模組及常用函式介紹

minigui常用介面美化方法，及常用函式使用

Numpy常用函式與矩陣運算

Python 集合的定義以及常用運算及函數

矩陣及矩陣運算

lambda 、 map 、filter 、reduce 及 reversed 常用函式

Oracle中時間日期格式轉換及常用日期函式

R: 矩陣運算及常用函式 II

相關推薦