1. 程式人生 > >R_數據操作(高級)_04

R_數據操作(高級)_04

ilo 密度 差分 ase edi 重構 expr article apply

數學函數:

abs(x)   絕對值    sqrt(x)  平方根    ceiling(x)  放回不小於x的最小整數   floor(x)  不小於x的最大整數   trunc(x)  先0方向截取x的整數部分

round(x, digits=n)  將x舍入為指定n位的小數   signif(x, digits=n)  將x舍入為指定n位的有效數字  sin(x),cos(x),tan(x)  正弦、余弦、正切

asin(x),acos(x),atan(x)  反正弦、反余弦、反正切           sinh(x),cosh(x),tanh(x)  雙曲正弦、雙曲余弦、雙曲正切

log(x, base=n)  對x取以n為底的對數  log(x)  自然對數      log10(x)  返回值為2.3026  log10(10)=1  exp(x)  指數函數

統計函數:

mean(x)  平均數  median(x)  中位數  sd(x)  標準差  var(x)  方差  mad(x)  絕對中位差   quantile(x, probs)  求分位數,例如:

# 求x 的30%和84%分位點   y <- quantile(x, c(.3,.84)) range(x)  求值域     diff(range(x))  求值域寬度  sum(x)  求和

diff(x, lag=n)  滯後差分,lag用來指定滯後幾項,默認為1    min(x)最小值    max(x)  最大值  scale(x, center=TRUE, scale=TRUE)  數據中心化或者二標準化

scale()一般對矩陣或者數據框進行均值為0,標準差為1的標準化,自定義SD為標準差,M為均值 scale(data)*SD+M

概率函數:

概率函數屬於特殊的統計類,通常用來生成分布一直的數據

[dpqr]distribution_abbreviation()

d = 密度函數(density)  p =分布函數(distribution function)  q =分位數函數(quantile function)  r =生成隨機數(隨機偏差)

常見分布:

技術分享圖片

設定隨機種子:set.seed()     runif(x)  生成x個在(0,1)區間上的隨機數

字符處理函數:

技術分享圖片

技術分享圖片

其他實用函數:

技術分享圖片

apply(x, MARGIN, FUN, ........)x數據對象;MARGIN表示維度(1對行數,2對列);FUN表示操作的函數

控制流

語句(statement)  條件(cond)  表達式(expr)  序列(aeq)

for (var in seq) statement  while(cond) statment  if (cond) else statment  if (cond) statment  ifelse(cond,statment)  switch(expr......)

整合與重構

轉置  t(data)

R_數據操作(高級)_04