自由 平等~忠誠 奉獻
knitr
謝亦輝前輩的作品, 關於可重複的統計研究的包,可以將R語言嵌入到markdown中進行程式設計,並可以生成pdf,doc,html等語言,方便文件的編寫.
formatR
也是謝亦輝前輩的作品, 可以對R 語言進行整理,不必擔心程式碼的亂七八糟.現在Rstudio已經集成了這個包可以使用 shift+ctrl(cmd)+A進行程式碼整理.
ggplot2
R語言作圖神器, 相當漂亮.
plyr
資料操作神器,對apply, sapply的升級版, 加入了進度條,並行操作.
dplyr
資料處理神器, plyr的升級版,主要用於資料框,可以實現與資料庫的快速互動。
data.table
讀取檔案,處理資料,速度比python,dplyr還要快。 就是語法上有些凌亂。
reshape2, tidyr
揉資料的法寶,將資料以不同的形式展現,列數由多變少, tidyr 是 reshape2 的升級版,主要用於資料框。
readr
2015-04-09 readr 釋出,同樣是dplyr的作者寫的包,C語言封裝,包括read_csv, read_delim速度比傳統的read.csv, read.delim更快
readxl
同樣是dplyr的作者寫的包,C語言編寫,不用安裝其他包就可以直接讀取excel 2007相容
httr
採用了RCurl,可以更快速的訪問網路, 提供了 GET, POST, cookie等設定
rvest
rvest用於爬取網路資料, 對網路資料進行分析,有點jquery的意思, 類似於python中的 beautiful soup
splitstackshape
Stack and Reshape Datasets After Splitting Concatenated Values, 資料分割重組的利器。 其中的cSplit函式可以將單元格中以特殊字符合並的字串進行分割,分割後增加行或列。
shiny
Rstudio 公司推出的包, 可以不懂html, 不懂javascript就可以做出漂亮的網頁.
sqldf
可以將data.frame視為表進行sql語句的操作, 預設使用sqlite3作為資料引擎,也可以根據自己的需要進行修改. 多表操作是如果設定索引速度會加快很多.
當然R主要是做統計分析和機器學習,這方便的包更是不勝列舉