1. 程式人生 > >R語言基本語句

R語言基本語句

read.table("*.txt",head=TRUE)   head表示資料第一行是否為檔案的頭

賦值  <-

陣列  c()

賦值函式  assign("變數名",c())

在第幾個分量求得最值  which.min() which.max()

求和  sum()

連乘  prod()

順序統計量  sort()

個數  length()

中位數  median()

均值 mean()

方差  var()

標準差  sd()

散點圖  plot()

直方圖  hist()

線性迴歸  lm(y~x,data=)

顯示詳細內容  summary()

產生有規律的序列:等差數列  a:b表示從a開始,逐項增加1,直到b的整數向量  a*b:c 表示ab,a(b+1)... ac   1:n-1 表示0,1,...n-1  等間隔函式seq(from=value1,to=value2,by=value3)  seq(length=value1,from=value2,by=value3)  重複函式  rep(x,times=) 向量重複

邏輯向量  可以對向量使用邏輯操作all()  any()

檢測缺失資料  is.na()  z[is.na(z)]<-0  缺失資料改為0

檢測資料是否不確定  is.nan()  0/0

檢測資料是否有限  is.finite()  1/0

字元型向量連成字串  paste(" "," ")中間用空格隔開 paste("X",1:6,sep="")"X1" "X2"..."X6"  paste(c('a','b'),collapse='.') "a.b"

複數向量  complex(re=實部,im=虛部)

物件和他的模式與屬性:固有屬性:mode和length

向量的mode有邏輯型、數值型、複數型、字元型、空值型 可以用is.型別來判斷是否是該型別  as.型別可以強制轉換

顯示屬性組成的列表  attributes()  可以用attire(object,name)的形式存取物件object的名為name的屬性

因子表示離散變數離散:factor(x,levels=sort(unique(x),na.last=TRUE),labels,exclude=NA,ordered=FALSE)  對於因子向量,可以用table()來統計頻數  

分組求平均值:tapply(X,INDEX,FUN=NULL,...,simplify=TRUE)  產生因子:gl(n,k.length=n*k,labels=1:n,ordered=FALSE)

多維陣列和矩陣:

矩陣的元素按列存放  維數向量:dim()   構造陣列:array(data=NA,dim=length(data),dimnames=NULL)   

構造矩陣:matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)  

矩陣轉置:t()  行列式:det()  矩陣合併:cbind()(自變數橫向拼成一個大矩陣)rbind()(自變數縱向拼成一個大矩陣)

內積:x%*%y  交叉乘積:crossprod(x,y)  叉積:tcrossprod(x,y)或者 outer(x,y)   

以v為對角線元素的對角陣:diag(v)  取矩陣對角線上的元素向量:diag(M)  

解線性方程組Ax=b:solve(A,b)  求矩陣A的逆:solve(A)

求對稱矩陣Sm的特徵值和特徵向量:eigen(Sm)  奇異值分解:svd(A)

最小二乘擬合:lsfit(X,y)  QR分解函式:qr(),qr.coef(),qr.fitted(),qr.resid()

列表:list()  每次只能飲用一個元素

資料框:data.frame()

把資料框或者列表的內容連結到記憶體中去:attach()

控制流:

分支語句:

if (cont_1)

   statement_1

else if (cond_2)

  statement_2

else

  statement_3

switch(statement,list) 如果表示式的返回值在1到length(list)之間,則返回列表相應位置的值,否則返回null

迴圈語句:

for(name in expr_1) expo_2

while(condition) expr

repeat expr

相關推薦

R語言基本語句

read.table("*.txt",head=TRUE)   head表示資料第一行是否為檔案的頭 賦值  <- 陣列  c() 賦值函式  assign("變數名",c()) 在第幾個分量求得最值  which.min() which.max() 求和  sum(

機器學習與R語言——基本語法

-s onedrive 和數 class 下載 取消 lan 選中 學習 一、註釋 1、選中要註釋的內容,快捷鍵Ctrl+Shift+C(取消註釋方法相同) 2、在需註釋內容前輸入# 1 #需註釋的內容 3、利用if語句,將判斷條件設置為false則可跳過if語句中的內

R語言-基本數據管理

tac math row 日期類 由於 format tile 格式轉換 運算 目的:學會對原始的數據集進行整理(日期,缺失值,變量創建等),然後通過修改後的數據集可以更有針對性的來分析數據 案例:分析男性和女性經理人在領導自己企業的不同   問題:1.處於管理崗的男性和女

R語言- 基本統計分析

kruskal 最大的 turn clas 技術 ria 大於 stat pair 目的:   1.描述性統計分析   2.頻數表和;列連表   3.相關系數和協方差   4.t檢驗   5.非參數統計 在上一節中使用了圖形來探索數據,下一步就是給出具體的數據來描述每個變量

R語言-基本資料結構的用法

關鍵詞:向量、矩陣、陣列、資料框、因子、列表 近期開始上手R語言,可能是出於對機器學習的興趣吧從而瞭解到這門語言; 之前也看過人生苦短的Python,當然這兩門語言都是人工智慧技術中很好的工具; 二者也存在一些相同之處,當然是除了開源之外的一些相同之處; 本人蔘考的書籍是R語言實戰[

R語言基本資料管理

建立新變數並整合到原來的資料框中: my_data <- transform(my_data, sum_x = x1 + x2, mean_x = (x1 + x2)/2) 變數的重編碼: lead

R語言基本備忘-統計分析

Part1 相關統計量說明 峰度係數Coefficientof kurtosis 峰度係數(Kurtosis)用來度量資料在中心聚集程度。在正態分佈情況下,峰度係數值是3(但是SPSS等軟體中將正態分佈峰度值定為0,是因為已經減去3,這樣比較起來方便)。>3的峰度

R語言基本操作函式

1.變數變換        as.array(x),as.data.frame(x),as.numeric(x),as.logical(x),as.complex(x),as.character(x),...轉換變數型別;使用如下命令可得到全部列表,methods(as) 

R語言基本函式、統計量、常用操作函式

先言:R語言常用介面操作 幫助:help(nnet) = ?nnet =??nnet 清除命令框中所有顯示內容:Ctrl+L 清除R空間中記憶體變數:rm(list=ls())、gc() 獲取或者設

R語言基本畫圖函式與多圖多線

常用統計作圖函式彙總 plot() hist() 直方圖 stem() 莖葉圖 boxplot() 箱線圖(盒形圖) coplot() 協同圖 qqnorm() 正態qq圖 qqplot() 兩總體qq圖 1. 高階低階圖形函式的常用選項 高、低

R語言實戰 - 基本數據管理(3)

cat taf str logs 合並 exc number country lob 8. 數據排序 > leadership$age [1] 32 45 25 39 NA > newdata <- leadership[order(leadership

R語言實戰 - 基本統計分析(1)- 描述性統計分析

4.3 summary eas 方法 func -- 4.4 1.0 6.5 > vars <- c("mpg", "hp", "wt") > head(mtcars[vars]) mpg hp wt Maz

[讀書筆記] R語言實戰 (四) 基本數據管理

mean 圖片 數值 函數 nbsp 一個 img order 分享 1. 創建新的變量 mydata<-data.frame(x1=c(2,2,6,4),x2=c(3,4,2,8)) #方法一 mydata$sumx<-mydata$x1+mydat

R語言筆記(一): 向量及向量的基本操作

R語言簡介:   R語言是一種統計繪圖語言,也指實現該語言的軟體; R語言是從S語言演變而來,S語言在20世紀70年代誕生於貝爾實驗室,其是用來進行資料探索/統計分析/作圖的解釋性語言; R語言是在1995年由紐西蘭某大學的學生基於S語言的原始碼編寫的一套能執行S語言的軟體,就

R語言速成_尹鴻(一)基本操作

賦值 > x <- 5 #賦值 > ls() #檢視已經建立的變數 [1] "x" > age <- c(1,3,5,2,11,9,3,9,12,3) > weight <- c(4.4,5.3,7.2,5.2,8.5,7.3,6.

機器學習演算法的基本原理-附Python和R語言程式碼

轉自:https://www.ziiai.com/blog/706 原文:https://www.analyticsvidhya.com/blog/2017/09/common-machine-learning-algorithms/ 一般來說,有3種類型的機器學習演算法 1.監督學習

R語言學習-第二課-變數的基本操作

1.變數變換         as.array(x),as.data.frame(x),as.numeric(x),as.logical(x),as.complex(x),as.character(x),...轉換變數型別;使用如下命令可得

R語言開發之迴圈結構的控制語句(break&next)瞭解下

迴圈控制語句用於更改程式正常執行順序,就是當執行離開範圍時,在該範圍內建立的所有自動物件都將被銷燬。我們來看下R支援的控制語句: 序號 控制語句 描述 1 break語句 終止迴圈語句並將執行轉移到迴圈之後的語句。 2 next語句

R語言繪製基本圖形

條形圖 函式barplot() > library(vcd) 載入需要的程輯包:grid > counts <- table(Arthritis$Improved) > counts None Some Marked 42

利用R語言進行基本資料管理

####建立leadership資料框 manager <- c(1, 2, 3, 4, 5) date <- c("10/24/08", "10/28/08", "10/1/08", "10/12/08", "5/1/09") country <- c("US", "US", "