1. 程式人生 > >自由 平等~忠誠 奉獻

自由 平等~忠誠 奉獻

knitr

謝亦輝前輩的作品, 關於可重複的統計研究的包,可以將R語言嵌入到markdown中進行程式設計,並可以生成pdf,doc,html等語言,方便文件的編寫.

formatR

也是謝亦輝前輩的作品, 可以對R 語言進行整理,不必擔心程式碼的亂七八糟.現在Rstudio已經集成了這個包可以使用 shift+ctrl(cmd)+A進行程式碼整理.

ggplot2

R語言作圖神器, 相當漂亮.

plyr

資料操作神器,對apply, sapply的升級版, 加入了進度條,並行操作.

dplyr

資料處理神器, plyr的升級版,主要用於資料框,可以實現與資料庫的快速互動。

data.table

讀取檔案,處理資料,速度比python,dplyr還要快。 就是語法上有些凌亂。

reshape2, tidyr

揉資料的法寶,將資料以不同的形式展現,列數由多變少, tidyr 是 reshape2 的升級版,主要用於資料框。

readr

2015-04-09 readr 釋出,同樣是dplyr的作者寫的包,C語言封裝,包括read_csv, read_delim速度比傳統的read.csv, read.delim更快

readxl

同樣是dplyr的作者寫的包,C語言編寫,不用安裝其他包就可以直接讀取excel 2007相容

httr

採用了RCurl,可以更快速的訪問網路, 提供了 GET, POST, cookie等設定

rvest

rvest用於爬取網路資料, 對網路資料進行分析,有點jquery的意思, 類似於python中的 beautiful soup

splitstackshape

Stack and Reshape Datasets After Splitting Concatenated Values, 資料分割重組的利器。 其中的cSplit函式可以將單元格中以特殊字符合並的字串進行分割,分割後增加行或列。

shiny

Rstudio 公司推出的包, 可以不懂html, 不懂javascript就可以做出漂亮的網頁.

sqldf

可以將data.frame視為表進行sql語句的操作, 預設使用sqlite3作為資料引擎,也可以根據自己的需要進行修改. 多表操作是如果設定索引速度會加快很多.

當然R主要是做統計分析和機器學習,這方便的包更是不勝列舉