R語言資料集取子集

阿新 • • 發佈：2018-11-10

保留變數：

>newdata<-leadership[,c(6:10)]

或者

> myvars<-c("item1","item2","item3","item4","item5")
> newdata<-leadership[myvars]

丟棄變數：

> myvars<-names(leadership)%in%c("item3","item4")
> newdata<-leadership[!myvars]
> newdata
  managerID testDate country gender age item1 item2 item5 agecat
1         1 10/24/08      US      M  32     5     4     5  Young
2         2 10/28/08      US      F  45     3     5     5  Young
3         3  10/1/08      UK      F  26     3     5     2  Young
4         4 10/12/08      UK      M  39     3     3    NA  Young
5         5   5/1/09      UK      F  NA     2     2     1   <NA>

或者

> newdata<-leadership[c(-8,-9)]

選入觀測：

> newdata<-leadership[1:3,]
//選擇第一行到第三行觀測

> newdata<-leadership[which(leadership$gender=="M"&leadership$age>30),]
//選擇了所有30歲以上的男性

使用subset()函式：

> newdata<-subset(leadership,age>=35|age<24,select=c(item1,item2,item3,item4))
//選擇了所有age值大於等於35或age值小於24的行，保留了變數item1到item4。

> newdata<-subset(leadership,gender=="M"&age>25,select=gender:item4)
//選擇了所有25歲以上的男性，並保留了變數gender到q4（gender、item4和其間所有列)

隨機抽樣：

> mysample<-leadership[sample(1:nrow(leadership),3,replace=FALSE),]
//從leadership資料集中隨機抽取一個大小為3的樣本
//sample(1:nrow(leadership)引數是一個由要從中抽樣的元素組成的向量
//3是要抽取的元素數量
//replace=FALSE表示無放回抽樣

相關：抽取和校正調查樣本的sampling包以及分析複雜調查資料survey包。

R語言資料集取子集

保留變數： >newdata<-leadership[,c(6:10)] &

R語言資料集行列互換技巧

現在給大家介紹的資料處理技巧是長轉寬，也就相當於Excel中的轉置，不過用R語言實現的長轉寬還有資料合併的功能，自然比Excel強大多了。這裡給大家介紹4個函式，其中melt()、dcast()來自reshape2包，gather（）、spread()來自tidyr包一、寬轉

R語言-資料框分組求平均值

【技術關鍵】 1、從excel把資料讀到資料框 2、演算法實現將資料框的一些資料合為新的資料並組成新的資料框 3、將處理結果，即新的資料框儲存到excel檔案（或.csv） 4、將繪圖結果輸出到PDF檔案儲存最近在嘗試分析近日的環境溫溼度變化；雖然裝置只運行了48小時左右；

R語言-資料結構

主站：https://lartpang.github.io/ 之前一陣子，在EDX上學習了R語言的一門基礎課程，這裡做個總結。這門課程主要側重於R的資料結構的介紹，當然也介紹了它的基本的繪圖手段。工作空間相關 ls() ## character(0) rm

基於30多萬條招聘資訊的熱門城市、地域、薪資、人才要求的R語言資料視覺化分析

又是一年畢業季，什麼工作好找、工資高、哪些地域有優勢等就是很多人關注的話題了。這裡用一份2017年初，含有32萬條資料（行）、19個詳細招聘資訊（列）的資料進行招聘資訊的知識發現、挖掘。資料部分截圖如下：需要完成的工作 1、資料預處理； 2、每個行業的招聘次數、平均工

分享《R語言資料分析與挖掘實戰(張良均等)》中文PDF+原始碼

下載：https://pan.baidu.com/s/1I7hm-LP5H3-57vsUjOxeNw 更多資料分享：https://pan.baidu.com/s/1g4hv05UZ_w92uh9NNNkCaA 《R語言資料分析與挖掘實戰(張良均等)》PDF+原始碼 PDF，339頁。配套資料與原始

CIFAR10資料集取一張視覺化儲存

transform = transforms.Compose([ transforms.Resize(96), transforms.ToTensor()

R 語言資料讀取與儲存

一、R語言讀取文字檔案： 1、檔案目錄操作：getwd() : 返回當前工作目錄setwd(“d:/data”) 更改工作目錄 2、常用的讀取指令readread.table() : 讀取文字檔案read.csv(): 讀取csv檔案如果出現缺失值，read.

R語言資料結構

向量向量是用於儲存數值型、字元型或邏輯型資料的一維陣列。單個向量中的資料必須擁有相同的型別或模式（數值型、字元型或邏輯型）。同一向量中無法混雜不同模式的資料。例如 a <- c(1,2,5,3,6,-2,4) 通過在方括號中給定元素所處位置的數值，我們可以訪

R語言資料離散化使funModeling變得容易

tl; dr：將數值變數轉換為分類，如下圖所示。閱讀時間〜6分鐘開始吧！該軟體包funModeling（從版本> 1.6.6）引入了兩個功能discretize_get_bins，它們discretize_df協同工作以幫助我們完成離

R語言--資料框

資料框資料框是一種矩陣形式的資料，資料框各列中的資料可以是不同型別的資料。資料框每一列認為是一個變數，每一行是一個觀測；看以看做是矩陣的推廣。資料框的生成函式：data.frame() 列入資料框列表的限制： 1：他的分量必須是向量 ---- 數值，字元，邏輯 ---

R語言資料框因子列表

資料框：data <- data.frame(col1,col2,)資料框patientID <- c(1,2,3,4)age <- c(25,34,28,52)diabetes <- c("Type1","Type2","Type3","Type2"

R語言資料處理之建立新變數

初步的資料處理，通常要建立新的變數。其實，建立新變數可以：避開未經處理的資料未有所需資料的難處；變換一些已有資料，以更好的為下一步分析作準備；而常建立的新變數有：缺失值指標 (Missingness indicators) ：指出在哪些地方有資料缺失分段

R語言資料框的常用操作

以下給出資料框常用的基本操作，儘量全面的給出一個完整的資料操作：目錄資料框概覽更改增加資料框列名資料框變數（variables）的篩選索引篩選的幾種格式條件篩選的方式資料框觀測（observations

R語言資料探勘(2) 資料預處理

一、資料清理檢查資料質量的重要性除了在建立模型之前需要完成資料清理，在對資料結構的探索和對模型的描述和預測過程中都需要不斷檢查資料質量探索的過程中，出現任何異常情況都需要解釋和處理。比如分類變數應該注意頻率特別低的類別，它可能是錯誤分類或者原本屬於相鄰類別的資料

R語言--資料介面（五）

1. CSV檔案獲取和設定工作目錄 # 獲取和設定工作目錄 print(getwd()) # 設定當前工作目錄 setwd("E:/R") print(getwd()) 列印結果：

【轉載】R語言資料處理——資料合併與追加

資料結構的塑造是資料視覺化前重要的一環，雖說本公眾號重心在於資料視覺化，可是涉及到一些至關重要的資料整合技巧，還是有必要跟大家分享一下的。在視覺化前的資料處理技巧中，匯入匯出、長寬轉換已經跟大家詳細的介紹過了。今天跟**家分享資料集的合併與追加，並且這裡根據所依賴函式的處理效率，給

R語言資料結構2—matrix

矩陣矩陣是一個二維陣列，只是每個元素都擁有相同的模式（數值型、字元型或邏輯型）。可通過函式matrix建立矩陣。一般使用為： matrix(vector = , nrow = , ncol = , byrow = ,dimnames = list(,)) 其中vec

R語言資料集合並、資料增減、不等長合併

每每以為攀得眾山小，可、每每又切實來到起點，大牛們，緩緩腳步來俺筆記葩分享一下吧，please~———————————————————————————資料選取與簡單操作：which返回一個向量中指定元素

R語言資料的排序和合並--ordered();rbind()

R語言資料的排序和合並 leadership借用前一章的： > leadership managerID testDate country gender age item1 item2 item3 item4 item5 1 1 10/14

R語言 資料集取子集

相關推薦

R語言資料集取子集