R語言資料讀取以及資料儲存
一、R語言讀取文字檔案:
1、檔案目錄操作:
getwd() : 返回當前工作目錄
setwd("d:/data") 更改工作目錄
2、常用的讀取指令read
read.table() : 讀取文字檔案
read.csv(): 讀取csv檔案
如果出現缺失值,read.table()會報錯,read.csv()讀取時會自動在缺失的位置填補NA
3、靈活的讀取指令scan() :
4、讀取固定寬度格式的檔案:read.fwf()
文字文件中最後一行的回車符很重要,這是一個類似於停止符的標識,否則讀入時會顯示“最後一行不完整”的警告,但是不影響資料讀入的效果。
5、讀取Excel資料:
(1)第一種方法
首先開啟Excel,選中需要的資料後複製,
然後再R中輸入以下的指令:data.excel =read.delim("clipboard") #clipboard即剪貼簿
(2)第二種方法:
使用RODBC包,獲取Excel連線的函式是odbcConnectExcel()和odbcConnectExcel2007() 分別讀取Excel2003版和2007版的資料channel =odbcConnectExcel2007("d:/a.xlsx")
sqlTables(channel)# 列出Excel中的表格
獲取Sheet1中的資料,可以使用如下任意的一種方式,
data.excel2 =sqlFetch(channel,"Sheet1")
data.excel2 =sqlQuery(channel,"select * from [Sheet1$]")
close(channel) #關閉ODBC連線,釋放空間
6、讀取網頁資料
readHTMLTable()函式
7、讀取R格式的檔案:
R的資料或者更一般的物件可以通過save()儲存為R專有的檔案格式,以Rdata為字尾,要讀取此類檔案,需要用到函式load()來載入,
8、readLines("d:/data/cat.txt"): 可以直接從連線中以行的形式來讀取文字
要顯示列表中的變數 需要使用符號$
二、資料儲存:
1、使用函式cat()
cat(...,file="",sep="",fill = FALSE ,labels=NULL,append=FALSE) #file表示要輸出的檔名,當引數append=TRUE時,在指定檔案的末尾新增內容。sep:表示以空格作為分隔符
2、儲存為文字檔案:
write僅可以寫出一個矩陣或向量的特定列,和對一個矩陣進行轉置
write.table() 可以把一個數據框或列表等物件以包含行列標籤的方式寫出。
write.csv(): 將資料框儲存為逗號分隔檔案,但是不包含列名
3、儲存R格式檔案:
save(data,file="d:/data/salary1.Rdata")
dim():求維度
mode() 用來顯示物件的型別
names():顯示物件中的標籤