R語言-陣列與資料框操作

阿新 • • 發佈：2019-01-01

1、陣列基本的操作：

1）、檢視陣列---直接呼叫陣列名回車；

2）、按照下標獲取陣列元素---呼叫陣列名+方括號+元素下標；

3）、檢視陣列長度（length()）；

4）、檢視陣列元素型別（mode(); ps:語言只支援陣列元素單一型別，及所有元素要麼都是字元，要麼都是數值）

5）、對陣列的操作還包括多個數組的包括，可以將兩個陣列組合成一個矩陣(R語言稱之為資料框：frame)，可以將陣列按照行向量組合rbind()和列方向的組合cbind();

> x1=c(1,2,3,4,5)
> x2=c('1','2','3','4','5')
> x1
[1] 1 2 3 4 5
> x1[4]
[1] 4
> x2
[1] "1" "2" "3" "4" "5"
> x2[4]
[1] "4"
> length(x1)
[1] 5
> mode(x1)
[1] "numeric"
> mode(x2)
[1] "character"
> m1<-rbind(x1,x2)
> m1
   [,1] [,2] [,3] [,4] [,5]
x1 "1"  "2"  "3"  "4"  "5" 
x2 "1"  "2"  "3"  "4"  "5" 
> m2<-cbind(x1,x2)
> m2
     x1  x2 
[1,] "1" "1"
[2,] "2" "2"
[3,] "3" "3"
[4,] "4" "4"
[5,] "5" "5"</span>

2、有關陣列的統計指標處理：

常見的統計指標包括：平均值(mean())、求和(sum())、連乘(prod())、最值(min()、max())、方差(var())、標準差(sd())

首先我們先借助R的快速生成陣列函式c(startNum:endNum)生成1到100個數字並存放於陣列y內，然後對其進行相應統計指標輸出，具體見下圖：

> y<-c(1:100)
> mean(y)
[1] 50.5
> sum(y)
[1] 5050
> prod(y)
[1] 9.332622e+157
> max(y)
[1] 100
> min(y)
[1] 1
> var(y)
[1] 841.6667
> sd(y)
[1] 29.01149

3、關於資料下標的相關處理

R語言提供了實用的下標處理函式，我們可以方便的取出理想資料，例如：

1）、取連續下標的元素；

2）、按照其他陣列元素的值取---以其他陣列元素的值取出相應本陣列對應下標的元素；

3）、按照元素值的大小取，如可以去除陣列中大於某個數的所有元素，小於某個數的所有元素等等；

4）、實用的which函式，which在陣列下標中代表該陣列物件，可以通過which取出陣列元素a[which()]，相應的也可以取出符合元素的下標which()；

5）、自排序函式(sort())和陣列反轉函式(rev());

<span style="font-weight: normal;"><span style="font-size:14px;">a=c(1,2,3,4,5,8,9,10,15555)
> a[1:5]
[1] 1 2 3 4 5
> a[a<5]
[1] 1 2 3 4
> a[a>4 &a<8]
[1] 5
> a[a[3]]
[1] 3
> which.max(a)
[1] 9
> a[which.max(a)]
[1] 15555
> which(a>1&a<5)
[1] 2 3 4
> a[which(a>1 &a<5)]
[1] 2 3 4
> a[which(a==9)]
[1] 9
> sort(a)
[1]     1     2     3     4     5     8     9    10 15555
> a
[1]     1     2     3     4     5     8     9    10 15555
> rev(a)
[1] 15555    10     9     8     5     4     3     2     1</span></span>

3、生成矩陣和矩陣操作相關函式：

R提供了陣列轉矩陣的函式（matrix()），矩陣是後續很多工作的開始:

1)、矩陣進行加減(+-)、相乘(%*%)：

Ps:陣列生成矩陣時，預設是按照列方向進行，可以加引數byrow=T,使其按行方向生成矩陣

a<-c(1:12)
> mat_a<-matrix(a,nrow=3,ncol=4)
> mat_a
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> mat_aa<-matrix(a,nrow=4,ncol=3)
> mat_aa
     [,1] [,2] [,3]
[1,]    1    5    9
[2,]    2    6   10
[3,]    3    7   11
[4,]    4    8   12
> mat_b<-matrix(a,nrow=3,ncol=4)
> mat_b
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> mat_a+mat_b
     [,1] [,2] [,3] [,4]
[1,]    2    8   14   20
[2,]    4   10   16   22
[3,]    6   12   18   24
> mat_a%*%mat_aa
     [,1] [,2] [,3]
[1,]   70  158  246
[2,]   80  184  288
[3,]   90  210  330</span>

2）、取對角線(diag())、轉置(t())

> mat_a
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> diag(mat_a)
[1] 1 5 9
> diag(4)
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    1    0    0
[3,]    0    0    1    0
[4,]    0    0    0    1
> t(mat_a)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12

3）、求逆(solve)、解線性方程組(solve)：

> a=matrix(rnorm(16),4,4)
> a
           [,1]       [,2]       [,3]         [,4]
[1,] -1.8060313 -0.1623095  1.6059096 -0.034760390
[2,] -0.5820759  0.5630558 -1.1578085 -0.669633580
[3,] -1.1088896  1.6478175  0.6565885 -0.007604756
[4,] -1.0149620 -0.7733534  2.5489911  1.777084448
> solve(a)
           [,1]       [,2]       [,3]       [,4]
[1,] -0.1579445 -0.8872690 0.12951969 -0.3368722
[2,] -0.2696348 -0.1950072 0.61120374 -0.0761404
[3,]  0.4008824 -0.9993255 0.20832490 -0.3678288
[4,] -0.7825607  0.8417821 0.04114366  0.8647852
> b=c(1:4)
> b
[1] 1 2 3 4
> solve(a,b)
[1] -2.8914122  0.8694004 -2.4441089  4.4835754

求特徵值特徵向量(eigen())

> a<-diag(4)+1
> a
     [,1] [,2] [,3] [,4]
[1,]    2    1    1    1
[2,]    1    2    1    1
[3,]    1    1    2    1
[4,]    1    1    1    2
> a.e=eigen(a,symmetric=T)
> a.e
$values
[1] 5 1 1 1

$vectors
     [,1]          [,2]       [,3]       [,4]
[1,] -0.5  0.000000e+00  0.0000000  0.8660254
[2,] -0.5 -6.408849e-17  0.8164966 -0.2886751
[3,] -0.5 -7.071068e-01 -0.4082483 -0.2886751
[4,] -0.5  7.071068e-01 -0.4082483 -0.2886751

R語言的基本資料結構—資料框

資料框也是矩陣形式，但不同於一般的矩陣，數控框中的列可以是不同的資料型別，每一列即為一個屬性值，每一行即為條記錄，或為一個物件的所有屬性的觀測值。

> x1=c(1:4)
> x2=c(rnorm(4))
> x3=c('52','72','03','789')
> x4=c(runif(4,min=10000,max=10005))
> y=data.frame(x1,x2,x3,x4)
> y
  x1         x2  x3       x4
1  1 -1.1386077  52 10002.51
2  2  1.3678272  72 10004.92
3  3  1.3295648  03 10001.62
4  4  0.3364728 789 10002.41

邏輯迴圈控制：

R語言支援for迴圈和while迴圈，兩種迴圈結構上和通用程式語言類似，但有少數差異。

> a
 [1]  1  2  3  4  5  6  7  8  9 10
> for(i in 1:10){a[i]=i*2+5}
> a
 [1]  7  9 11 13 15 17 19 21 23 25
> a=c(1:10)
> a
 [1]  1  2  3  4  5  6  7  8  9 10
> i=1
> while (a[i]<5){a[i]=a[which.max(a)];i=i+1}
> a
 [1] 10 10 10 10  5  6  7  8  9 10

-------排序（降序） e=d[order(d$盈利,decreasing = TRUE),]

R語言-陣列與資料框操作

1、陣列基本的操作： 1）、檢視陣列---直接呼叫陣列名回車； 2）、按照下標獲取陣列元素---呼叫陣列名+方括號+元素下標； 3）、檢視陣列長度（length()）； 4）、檢視陣列元素型別（mode(); ps:語言只支援陣列元素單一型別，及所有元素

R語言Data Frame資料框常用操作

Data Frame一般被翻譯為資料框，感覺就像是R中的表，由行和列組成，與Matrix不同的是，每個列可以是不同的資料型別，而Matrix是必須相同的。 Data Frame每一列有列名，每一行也可以指定行名。如果不指定行名，那麼就是從1開始自增的Sequence來標

R語言中的資料框合併

#兩個資料框有相同和不同列----合併 ID<-c(1,2,3,4) name<-c("A","B","C","D") score<-c(60,70,80,90) student1<-data.frame(ID,name) student2<-

◮ R語言筆記(四): 向量、陣列、矩陣與資料框 + 利用矩陣求解二維線性方程組

在筆記一中已經提到了向量，這篇文章主要介紹R語言中的四中常用的結構：向量：*傳送門* 陣列矩陣資料框然後在介紹如何利用矩陣求解二維線性方程組。 ***************************************************

R語言入門之建立資料集——向量、矩陣、陣列、資料框和列表

摘要隨著大資料的火爆發展，適合資料分析及生成圖表的R語言也在“最受歡迎的程式語言”中上升到了17位。R語言的種種特性令其十分易於進行資料分析，並因其能通過簡短的程式碼生成一目瞭然的圖令眾多資料分析師垂涎三尺。進行資料分析的第一步是先拿到資料，本文就簡單描

R語言開發之資料型別之陣列&因子&資料幀

咱們接著上篇文章來啊，上篇文章最後說道矩陣，但是矩陣只能有兩個維度，然而陣列可以是任意數量的維數。R語言中陣列函式採用一個dim屬性，建立所需的維數。在下面的例子中，我們嘗試建立一個有三個元素的陣列，

讀書筆記之資料框操作與常用函式

如何把列表轉化為整齊的矩陣？ mylist<-as.list(iris[,1:4]) result<-sapply(mylist,mean) result<-lapply(mylist,mean) #結果【1】Sepal.Length Sepal.Width P

R語言文件相關的操作

文件權限 min git -1 長度 rename path ech 作用 1. 文件系統介紹 R語言對文件系統的操作，包括文件操作和目錄操作，函數API都定義在base包中。 2. 目錄操作 2.1 查看目錄查看當前目錄下的子目錄。 # 啟動R程序 ~

R語言csv與txt文本讀入區分（sep參數）

系統文件格式 inux 完整路徑 r語言 table weight 系統環境 dos R語言csv與txt文本讀入區分 R語言用來處理數據很方便，而處理數據的第一步是把數據讀入內存空間，平時最常用的文本數據儲存格式有兩種；一種是CSV（逗號分隔符文本）另一種是TXT（T

用R語言分析與預測員工離職

在實驗室搬磚之後，繼續我們的kaggle資料分析之旅，這次資料也是答主在kaggle上選擇的比較火的一份關於人力資源的資料集，關注點在於員工離職的分析和預測，依然還是從資料讀取，資料預處理，EDA和機器學習建模這幾個部分開始進行，最後使用整合學習中比較火的random forest演算法來預

【兩行命令】R語言讀取excel資料

安裝庫安裝xlsx install.packages("xlsx") 使用 library(xlsx) ray = read.xlsx('D:/Code/R/Data in Excel/Chapter 8/gamma-ray.xls',1) 後面的引數，第一個放

R語言實驗：資料探索

資料介紹使用銀行對資產進行評估的資料bank-data.csv，資料裡有12個屬性，分別是id,age,sex,region,income,married,children, car, save_act, current_act,

2-7 R語言基礎數據框

score col true data gen matrix frame [1] 基礎 #數據框 > df <- data.frame(id=c(1,2,3,4),name=c("a","b","c","d"),gender=c(TRUE,TRUE,FALS

R語言處理日期資料

《R語言實戰》學習筆記 —— 基本資料管理之日期值 1. 建立日期型變數日期型通常以字串形式輸入到R中，然後轉化為以數值形式儲存的日期變數。日期具有一定的格式，見下表：表1 日期格式符號含義示例

Twitter基於R語言的時序資料突變檢測（BreakoutDetection）

Twitter開源的時序資料突變檢測（BreakoutDetection）,基於無參的E-Divisive with Medians (EDM)演算法，比傳統的E-Divisive演算法快3.5倍以上，並且具有魯棒統計性，就是你加入一些離群點或異常點，並不影響該演算法的檢測效果，不過最關鍵的還是

C語言程式設計與資料結構

第一部分 C語言程式設計一、C語言基礎知識 1、如何學習 2、第一個程式程式主要框架 3、變數

R語言輸入與輸出

R讀取xls檔案方法： readxl包可以很方便的讀取,且各個系統都通用。如果只是讀取的話，無疑是非常方便的方法。只需要下載readxl包，用read_excel函式讀取就可以了，並且同時支援老版本的.xls格式和新版本的.xls

R語言中的資料結構

R語言中的資料結構文字中對R語言中的資料結構進行總結，以說明和舉例的方式展現出來！主要包含：向量，陣列，列表，資料框，因子，矩陣，和一些常用函式。注：以下程式碼均可直接執行！ 1、向量向量，用於儲存數值型，字元型，邏輯型資料的一維陣列同一向量中無法混雜不同模式的資料

字元型別char、字串與字元陣列、字元陣列與資料陣列區別

字元型別是以ASCII碼值運算的：小寫字母比相應的大寫字母大32，其中A=65,a=97 Esc鍵 27（十進位制）、'\x1B'（十六進位制）、'\33'（八進位制）轉義字元：\0 空字元\n 換行\r 回車\t 水平製表符（Tab鍵）\' 單引號\" 雙引號\\ 反斜槓 char c='M';

C語言陣列與指標並不相同---《C專家程式設計》

1. 陣列和指標的訪問初接觸C語言時，常發現在很多情況下陣列和指標的使用是可以互換的，因此對兩者的區分相對含混不清。但在某些情況下卻編譯報錯無法執行，比如在一個檔案中定義為陣列int s[100]；在另一個檔案中宣告為指標extern int *s；兩者間將會

R語言-陣列與資料框操作

1、 陣列基本的操作：

2、有關陣列的統計指標處理：

3、 關於資料下標的相關處理

3、生成矩陣和矩陣操作相關函式：

R語言的基本資料結構—資料框

邏輯迴圈控制：

相關推薦

1、陣列基本的操作：

3、關於資料下標的相關處理