dataframe第二列 r語言_R語言百問百答(110)
技術標籤:dataframe第二列 r語言r dataframe 轉成向量設計sample語言的語法
1. R語言中有哪些資料結構?
R語言的資料結構包括以下幾種型別:
向量(Vector):一組相同型別的資料元素。向量中的成員叫做成分(Component)。
列表(List): 是R語言中包括不同型別元素(數值、字串、向量或者另一個列表)的物件。
矩陣(Matrix): 是一個二維資料結構,由相同長度的向量構成。矩陣中的元素需為同一型別(例如數值或者字元等)。
資料框(Dataframe): 更廣義的矩陣。不同的列可以具有不同的資料型別。它結合了矩陣和列表的特徵,更像是一個矩形列表。
2. R語言中如何讀取csv檔案?
可以用read.csv()函式讀取csv檔案,例如:
stock
3.影象語法(Grammar of graphics)有哪些不同的組成部分?
在ggplot2庫中實現了分層影象語法,其中包括資料(Data)層,美學(Aesthetics)層,幾何(Geometry)層,小平面(Facet)層,座標(Co-ordinate)層和主題層。
延伸閱讀:The grammar of graphics
https://cfss.uchicago.edu/notes/grammar-of-graphics/
4.什麼是RMarkdonw?它有什麼用途?
RMarkdown是R語言中生成報表的工具。我們可以利用RMarkdown產生好看的報表。它可以產生HTML,PDF以及Word版本的報表。
5.如何在R語言裡安裝程式包?
R語言的程式包是由R語言的使用者自己開發的函式和資料的集合。這些程式包大大提高了R語言的功能。使用者在用這些程式包之前,需要自己安裝。例如要安裝mice程式包,就可以用
install.packages("mice")
6.R語言裡怎麼跑線性迴歸?
首先,我們利用sample.split()函式把資料分為訓練集(Training dataset)和測試集。
第二步,就可以用lm()函式建立線性模型了。
第三步,我們可以用predict()函式做預測。
最後,我們可以計算RMSE等指標,評估模型水平。
7.R語言中有哪些程式包可以用來資料歸責(data imputation)?
在統計學裡,資料歸責是用一定的數值代替缺失資料(missing data)的過程。R語言中用於資料歸責的程式包有:
mice
Amelia
missForest
Hmisc
Mi
imputeR
8.什麼是R語言中的混淆矩陣(Confusion matrix)?
混淆矩陣用於衡量模型的精度。它產生觀察值和預測值之間的表格。以下是H2O程式包產生的混淆矩陣。
當然,你也可以用confusionMatrix()函式產生混淆矩陣。
9.R語言裡怎麼自己定義函式?
不論R語言有多少個程式包,你總是會需要自己定義一些函式。這個和別的語言大同小異。R語言中自定義函式的格式為:
=function(x){…………}
我們來看一個例子。你要定義一個名為JT的函式,當數值大於4的時候,返回1,否則返回0。(你可以理解為我們玩一個擲骰子游戲,1,2,3,4算你贏,5,6算我贏。)
> JT function(x){ifelse(x>4,1,0) }> v > v > JT function(x){ifelse(x>4,1,0) }> v > v > v輸出結果:[1] 0 0 0 0 1 1
原來v中的值為1-6。在使用了JT函式後,前4個數變成了0,而後兩個數變成了1。
10. 請列舉一些dplyr中的函式。
程式包dplyr中的函式包括filter,select, mutate, arrange, count等。