R語言中apply函式家族

阿新 • • 發佈：2019-02-10

apply

簡單說明：對陣列或者矩陣的一個維度使用函式生成值得到列表或者陣列、向量。

語法規則:
apply(X, MARGIN, FUN, ...)

簡單釋義：
X:陣列，包括矩陣
MARGIN:1表示矩陣行，2表示矩陣列，也可以是c(1,2)
FUN:自定義函式

示例：

#構建４*5的矩陣，按行排列
mat<-matrix(data = 1:20,nrow = 4,byrow = T)
#計算矩陣每列的均值
apply(X = mat,MARGIN = 1,FUN = mean)

結果：

[1]  3  8 13 18

lapply

簡單說明：通過對x的每一個元素運用函式，生成一個與元素個數相同的值列表。

語法規則：
lapply(X, FUN, ...)

簡單釋義：
X：表示一個向量或者表示式物件，其餘物件將被通過as.list強制轉換為list

示例：

x<-list(a=1:20,b=exp(-3:3),c=c(T,T,F,F,T))
#獲取列表中每個元素的長度
lapply(x,FUN = length)

結果：

$a
[1] 20
$b
[1] 7
$c
[1] 5

sapply

簡單說明：使用者友好版本，是lapply函式的包裝版，該函式返回結果是向量或者矩陣，如果simplify=“array”，且合適的情況下，將會通過simplify2array()函式轉換為陣列。

語法規則：
sapply(X, FUN, ..., simplify = TRUE, USE.NAMES =TRUE)

簡單釋義：
X:向量或者表示式物件，其餘物件將會通過as.list強制轉換為list
simplify:邏輯值或者字串，預設值為TRUE，若合適將返回一個向量或者矩陣，如果simply="array",結果將返回一個陣列。USE.NAMES為邏輯值，如果為TRUE，且x沒有被命名，則對x進行命名。

示例：

#檢視iris資料集的模式和類
sapply(iris,mode)
sapply(iris,class)
#命名
k<-c('a','b','c')
sapply(k,FUN 
 = paste,simplify = F,USE.NAMES = F,1:5)

結果：

> sapply(iris,mode)
Sepal.Length  Sepal.Width Petal.Length  Petal.Width      Species 
   "numeric"    "numeric"    "numeric"    "numeric"    "numeric" 
> sapply(iris,class)
Sepal.Length  Sepal.Width Petal.Length  Petal.Width      Species 
   "numeric"    "numeric"    "numeric"    "numeric"     "factor" 
> k<-c('a','b','c')
> sapply(k,FUN = paste,simplify = F,USE.NAMES = F,1:5)
[[1]]
[1] "a 1" "a 2" "a 3" "a 4" "a 5"
[[2]]
[1] "b 1" "b 2" "b 3" "b 4" "b 5"
[[3]]
[1] "c 1" "c 2" "c 3" "c 4" "c 5"

vapply

簡單說明：和sapply函式類似，但是返回值有預定義型別，使用起來更加安全。

語法規則：
vapply(X, FUN, FUN.VALUE, ..., USE.NAMES = TRUE)

簡單釋義：
X:向量或者表示式物件，其餘物件將被通過as.list強制轉換為list
FUN.VALUE:一個通用型向量，FUN函式返回值的模板
simplify:邏輯值或者字串，結果應該被簡化為向量、矩陣或者高維陣列。必須是命名的，不能是簡寫。預設值是TRUE，若合適將會返回一個向量或者矩陣。如果simplify="array"，結果將返回一個陣列。
USE.NAMES:邏輯值，如果為TRUE，且x沒有被命名，則對x進行命名。

示例：

#構建資料框
dat<-data.frame(a=rnorm(100,1,2),b=rnorm(100,1,1),c=rnorm((100,1,3)))
#計算資料框中每個向量的均值
vapply(dat,mean,FUN.VALUE = c(mean=0))
#自定義函式計算均值和標準差
FUN<-function(x){
  list(mean(x),sd(x))
}
vapply(dat,FUN,FUN.VALUE = list(mean=0,sd=0))

結果：

> dat<-data.frame(a=rnorm(100,1,2),b=rnorm(100,1,1),c=rnorm(100,1,3))
> vapply(dat,mean,FUN.VALUE = c(mean=0))
        a         b         c 
0.8872571 1.0363621 0.9981886 
> 
> FUN<-function(x){
+   list(mean(x),sd(x))
+ }
> vapply(dat,FUN,FUN.VALUE = list(mean=0,sd=0))
     a         b         c        
mean 0.8872571 1.036362  0.9981886
sd   1.900742  0.8051695 3.141448

tapply

簡單說明：對不規則陣列使用向量，即對一組非空值按照一組確定因子進行相應計算。

語法規則：
tapply(X, INDEX, FUN, ..., simplify = TRUE)

簡單釋義：
x:是一個向量
INDEX:因子列表，和x長度一樣，元素將被通過as.factor強制轉換為因子

示例：

age<-c(60,54,86,47,58,86)
sex<-c("M","M","F","M","M","F")
tapply(age, sex,FUN = mean)

結果：

    F     M 
86.00 54.75

mapply

簡單說明：是sapply的多變數版本。將對…中的每個引數執行FUN函式，如有必要，引數將被迴圈。該函式的第一個引數為指定的函式，第二個引數為指定函式的引數。

語法規則：
mapply(FUN, ..., MoreArgs = NULL, SIMPLIFY = TRUE,USE.NAMES = TRUE)

簡單釋義：
MoreArgs:FUN函式的其他引數列表
SIMPLIFY:邏輯或者字串，可以減少結果成為一個向量、矩陣或者更高維陣列
USE.NAMES:邏輯值，如果第一個引數...已被命名，將使用這個字元向量作為名字

示例：

#針對1 2 3 4分別重複4 3 2 1次
mapply(FUN = rep,1:4,4:1)

#尋找字串中字母和數值緊密相連的字元並擷取
char<-c("d12jsfl","df13djklf","sd5jglkjg","djf2dlk")
result<-gregexpr(pattern = '[a-z][0-9]',char)
fun<-function(x,y){
  substring(x,y,y+attr(y,'match.length')-1)
}
mapply(fun,char,result)

結果：

> mapply(FUN = rep,1:4,4:1)
[[1]]
[1] 1 1 1 1
[[2]]
[1] 2 2 2
[[3]]
[1] 3 3
[[4]]
[1] 4

> char<-c("d12jsfl","df13djklf","sd5jglkjg","djf2dlk")
> result<-gregexpr(pattern = '[a-z][0-9]',char)
> fun<-function(x,y){
+   substring(x,y,y+attr(y,'match.length')-1)
+ }
> mapply(fun,char,result)
  d12jsfl df13djklf sd5jglkjg   djf2dlk 
     "d1"      "f1"      "d5"      "f2"

總結：

apply()的被分析物件必須且只能是矩陣或陣列
tapply()的被分析物件必須且只能是向量
sapply()的被分析物件必須且只能是向量或列表
lapply()的被分析物件必須且只能是向量或列表
vapply()的被分析物件必須且只能是向量或列表
mapply()的被分析物件必須是函式

宣告：
本博文始發於微信公眾號：砍柴問樵夫
想了解更多內容請關注：
這裡寫圖片描述

R語言中apply函式家族

apply 簡單說明：對陣列或者矩陣的一個維度使用函式生成值得到列表或者陣列、向量。語法規則: apply(X, MARGIN, FUN, ...) 簡單釋義： X:陣列，包括矩陣 MARGIN:1表示矩陣行，2表示矩陣列，也可以是c(1,2) FU

R語言中Legend 函式的引數詳解

legend(x, y = NULL, legend, fill = NULL, col = par("col"), border = "black", lty, lwd, pch,

R語言中plot()函式裡的6種邊框

R語言中，設定plot(x,y,'..., bty="o",..)裡引數bty，就可以不同的6種邊框了。 bty可以取6種字元，分別為“o”、“l”、“7”、“c”、“u”、“]”。這些字元代表6種邊框。 bty=“o” 繪製圖形的上邊框、下

R語言中paste函式的引數sep和collapse詳解

R語言用於拼接字串的函式主要有兩個： paste (..., sep = " ", collapse = NULL) paste0(..., collapse = NULL) 其中paste0函式式paste函式的縮減版本，少了一個引數sep。引數中的.

R語言中的scale函式及標準化和歸一化的理解

在不同組資料間存在差異時，經常要進行標準化或者歸一化處理，標準化，歸一化及scale的具體理解見https://blog.csdn.net/tanzuozhev/article/details/50602051，待我日後

R語言中的attach()和detach()函式

attach() 和detach()用$ 符號訪問物件不是非常的方便，如accountants$statef。一個非常有用的工具將會使列表或者資料框的分量可以通過它們的名字直接呼叫。而且這種呼叫是暫時性的，沒有必要每次都顯式的引用列表名字。函式attach() 除了可以用

全面了解R語言中的k-means如何聚類？

聚類下面將在iris數據集上演示k-means聚類的過程。先從iris數據集中移除Species屬性，然後再對數據集iris調用函數kmeans，並將聚類結果存儲在變kmeans.result中。在下面的代碼中，簇的數目設置為3。iris2 <- irisiris2$Species <- NULL

rugarch包與R語言中的garch族模型

-m c函數 hcl null station fpm IT dual list 來源：http://www.dataguru.cn/article-794-1.html rugarch包是R中用來擬合和檢驗garch模型的一個包。該包最早在http://rgarch.r

R語言中tidyverse基礎知識彙總

tidyverse group_by 分組統計 gather()和spread() 簡單地說，gather()是列轉行，而spread()是行轉列。請看下面的示例： > df id class grade 1 1 a 81 2 2 b 82 3 3

c語言中 gotoxy() 函式的使用

轉自 https://blog.csdn.net/radjedef/article/details/79028329 #include <stdio.h> #include <windows.h> void gotoxy(int x, int y) {

關於C語言中printf函式“輸出歧視”的問題

目錄關於C語言中printf函式“輸出歧視”的問題問題描述探索問題原因另一種研究方法問題結論關於C語言中printf函式“輸出歧視”的問題問題描述昨天晚上被問到一個問題，為什麼在同一個printf函式中兩次輸出一個double型變

c語言中rand()函式的用法筆記

最近在學著用c寫一些小程式，過程中遇到很多問題，在網上查很多大神的講解，以及查閱vs2010的幫助文件。在此做個筆記，以便今後查閱，備忘。感謝無私奉獻講解的大神們！一、rand() rand()函式用來產生隨機數，但是，rand()的內部實現是用線性同餘法實現的，是偽隨機數，由於週期較長，

(C語言中printf函式讀取的具體分析)

(C語言中printf函式讀取的具體分析) 不多說，直接上。printf函式將傳入的資料傳送到記憶體堆區（緩衝區），然後再根據前面的（格式說明符一個個讀取，這樣會造成錯誤） #include<stdio.h> #include<limits.h> #incl

C語言中main函式引數使用

在C99標準中定義main函式兩種正確的寫法 int main(void); int main(int argc, char* argv[]); 常見的不標準寫法 void main() main()

R語言中的as.Date

剛剛在處理從ACCESS返回的資料時，無意中發現所有資料的日期比實際少了一天，認真檢查原資料以後，沒有發現丟失，於是推斷可能是由於時區的轉換問題，查看了幫助，系統預設是UTC時區，而資料中的日期字元為CTS，如"2018-02-13 CST"，的轉換過程中加入引數as.Dat

R 語言中，資料框依據不同列進行排序

在R中處理資料框型別的資料時候，經常會遇到根據資料框中某一列來對整個資料框進行排序的情況。同時，當主列排序完成之後，會有相同級別的多行資料存在，這時可能就需要依照另外一列進行次級排序。下面的程式碼通

C語言中strlen函式的模擬實現n種方法

strlen 函式採用遞迴形式編寫 # include <stdio.h> # include <stdlib.h> int strlen (char* num) // 形參接受實參傳遞的陣列 {

R語言中的vector(向量)，array(陣列)總結

對於那些有一點程式設計經驗的人來說，vector，matrix，array，list，data.frame就相當於程式語言中的容器，因為只是將R看做資料處理工具所以它們的底層是靠什麼實現的，記憶體怎麼處理的具體也不要深究。 R語言很奇怪的是它是面向物件的語言，所以經常會呼叫

C語言中scanf函式輸入回車符的問題

在用c語言編寫輸入語句的時候常用到scanf函式，初學者在剛用scanf函式輸入時，經常會遇到各種各樣的輸入錯誤，最重要的是一定要記住scanf函式的輸入格式，scanf函式裡包含了哪些東西，輸入的時候就必須有哪些東西，比如：scanf("%c%c%c")，那麼輸入的時

使用R語言中的tidyverse進行分組處理

使用tidyverse包可以方便地進行分組處理。 > data name id grade 1 a 1 60 2 a 2 NA 3 b 3 60

R語言中apply函式家族

apply

lapply

sapply

vapply

tapply

mapply

相關推薦