R語言中的data.frame資料索引
在R語言中,data.frame是由類似於關係資料表中的一行一行資料構成,在做資料錄入過程中,難免有許多資料是缺失的,比如說用read.csv錄入部分資料時,如果缺失會用NA來代替,那麼我希望我檢索資料的時候使用非NA的資料,怎麼處理呢?
比如說data1是data.frame,有兩列資料,那麼我希望抽取兩列資料中第一列資料,且第二列資料非NA的資料,在R語言中,我們可以用命令
data1[ is.na(data1[,2])!=TRUE,1]
來獲取
第一個命令is.na(data1[,2])!=TRUE獲得是一個真假值的列表
相關推薦
R語言中的data.frame資料索引
在R語言中,data.frame是由類似於關係資料表中的一行一行資料構成,在做資料錄入過程中,難免有許多資料是缺失的,比如說用read.csv錄入部分資料時,如果缺失會用NA來代替,那麼我希望我檢索資料的時候使用非NA的資料,怎麼處理呢? 比如說data1是data.fr
如何將R中的data frame物件的資料匯入到DB
在使用ARIMA模型來預測我們的銷量的時候,如果儲存預測版本進DB,以供後續分析呢 1. 在定義變數階段我們定義了dfResult <- data.frame() 這是一個data frame 2. 預測的結果通常是一個vector 例如我們預測9
R 語言中,資料框依據不同列進行排序
在R中處理資料框型別的資料時候,經常會遇到根據資料框中某一列來對整個資料框進行排序的情況。 同時,當主列排序完成之後,會有相同級別的多行資料存在,這時可能就需要依照另外一列進行次級排序。 下面的程式碼通
R語言Data Frame資料框常用操作
Data Frame一般被翻譯為資料框,感覺就像是R中的表,由行和列組成,與Matrix不同的是,每個列可以是不同的資料型別,而Matrix是必須相同的。 Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那麼就是從1開始自增的Sequence來標
全面了解R語言中的k-means如何聚類?
聚類下面將在iris數據集上演示k-means聚類的過程。先從iris數據集中移除Species屬性,然後再對數據集iris調用函數kmeans,並將聚類結果存儲在變kmeans.result中。在下面的代碼中,簇的數目設置為3。iris2 <- irisiris2$Species <- NULL
rugarch包與R語言中的garch族模型
-m c函數 hcl null station fpm IT dual list 來源:http://www.dataguru.cn/article-794-1.html rugarch包是R中用來擬合和檢驗garch模型的一個包。該包最早在http://rgarch.r
R語言中tidyverse基礎知識彙總
tidyverse group_by 分組統計 gather()和spread() 簡單地說,gather()是列轉行,而spread()是行轉列。 請看下面的示例: > df id class grade 1 1 a 81 2 2 b 82 3 3
R語言中的as.Date
剛剛在處理從ACCESS返回的資料時,無意中發現所有資料的日期比實際少了一天,認真檢查原資料以後,沒有發現丟失,於是推斷可能是由於時區的轉換問題,查看了幫助,系統預設是UTC時區,而資料中的日期字元為CTS,如"2018-02-13 CST",的轉換過程中加入引數as.Dat
【R語言】data.frame與data.table的效能比較
測試案例說明 總資料量為6000條。平均的分佈在20個data.frame/data.table變數中。 這20個變數儲存在list中,以1:20表示。 將20個變數合併成一個。 資料格式一致。 用d
R語言中的scale函式及標準化和歸一化的理解
在不同組資料間存在差異時,經常要進行標準化或者歸一化處理,標準化,歸一化及scale的具體理解見https://blog.csdn.net/tanzuozhev/article/details/50602051,待我日後
R語言中的vector(向量),array(陣列)總結
對於那些有一點程式設計經驗的人來說,vector,matrix,array,list,data.frame就相當於程式語言中的容器,因為只是將R看做資料處理工具所以它們的底層是靠什麼實現的,記憶體怎麼處理的具體也不要深究。 R語言很奇怪的是它是面向物件的語言,所以經常會呼叫
使用R語言中的tidyverse進行分組處理
使用tidyverse包可以方便地進行分組處理。 > data name id grade 1 a 1 60 2 a 2 NA 3 b 3 60
R語言中Legend 函式的引數詳解
legend(x, y = NULL, legend, fill = NULL, col = par("col"), border = "black", lty, lwd, pch,
R語言中plot()函式裡的6種邊框
R語言中,設定plot(x,y,'..., bty="o",..)裡引數bty,就可以不同的6種邊框了。 bty可以取6種字元,分別為“o”、“l”、“7”、“c”、“u”、“]”。這些字元代 表6種邊框。 bty=“o” 繪製圖形的上邊框、下
關於R語言中set.seed()
在r中取sample時候,經常會有set.seed(某數),經常看見取值很大,其實這裡無論括號裡取值是多少,想要上下兩次取值一樣,都需要在每次取值前輸入同樣的set.seed(某數),才能保證兩次取值相同。 set.seed(1) x<-rnorm(5) set.se
在R語言中,使用“=”和“
R裡通常用符號”<-”代替其它語言裡的”=”來作賦值符號。因為前者敲起來比等號要麻煩,且大部分情況下兩者是等價的,所以通常就愉懶依舊用”=”來賦值。但要切記兩者在某些時候是有區別的。字面上的解釋,可以認為”<-”是賦值,”=”是傳值。在函式呼叫中,func
理解R語言中的factor
轉載和整理自,向作者表示感謝 在R語言中,因子(factor)表示的是一個編號或者一個等級,即,一個點。例如,人的個數可以是1,2,3,4……那麼因子就包括,1,2,3,4…..還有描述協變數水平時,會用到高、中、低,也是因子,因為這些都是一個點。與之區別
R語言中的cor和cov
大學時候的知識忘的還真差不多了。。。 R語言: cor函式計算的是列與列間的相關係數,得到的舉證C(i,j)是第i列與第j列相關係數。 相關係數的計算公式參考: http://baike.baidu.c
R語言中apply函式家族
apply 簡單說明:對陣列或者矩陣的一個維度使用函式生成值得到列表或者陣列、向量。 語法規則: apply(X, MARGIN, FUN, ...) 簡單釋義: X:陣列,包括矩陣 MARGIN:1表示矩陣行,2表示矩陣列,也可以是c(1,2) FU
go語言中beego框架資料輸出和返回json詳解
beego框架中資料輸出 1.直接輸出字串 beego.Controller.Ctx.WriteString(“字串”) func (ctx *Context) WriteString(content string) { ctx.ResponseWrit