1. 程式人生 > >R語言學習筆記1

R語言學習筆記1

1、中文文字挖掘軟體包:tmcn

2、用來消除兩向量、列表、資料框等中的相同行或列用函式:setdiff()

3、建立一個空陣列,用來裝不確定長度資料用方法:a <- numeric()

4、將字串格式日期轉換為Date格式用函式:as.Date(),以數值形式儲存,對於R中規定的標準格式:年-月-日或者       年/月/日,則可以不需要用format指定格式;如果輸入的格式不規則,則需要通過format指定的格式讀入。

      提取形如{3,4}中的數值型數字3和4,可用方法有:

                    

5、出現:Error in if(a & b): argument is of length zero錯誤時,其錯誤的原因是a或b中有一個或多個值為0或NULL,此       時換種方法去掉NULL或0值即可。如果是用which判斷某向量中是否含有某元素時,用如下方法就會出現該錯誤:

            if(which(related==users.all[i])==as.integer(0)){}
            Error in if (which(related == users.all[i]) == as.integer(0)) { :  argument is of length zero  

      如果which判斷的向量中不含該元素,則表明得到的結果向量長度為0,此時可用方法:

            if(length(which(related==related))==0){}

      來解決問題。               

相關推薦

R語言學習筆記1

1、中文文字挖掘軟體包:tmcn 2、用來消除兩向量、列表、資料框等中的相同行或列用函式:setdiff() 3、建立一個空陣列,用來裝不確定長度資料用方法:a <- numeric() 4、將字串格式日期轉換為Date格式用函式:as.Date(),以數值形式儲存,

R語言學習筆記(1):R是什麼

R初窺 從CRAN(The Comprehensive R Archive Network)cran.r-project.org—mirrors.html中選擇一個映象,然後下載合適的安裝包(R支援Linux、Mac OS X和Windows)。 安裝並

R語言學習筆記-機器學習1-3章

在折騰完爬蟲還有一些感興趣的內容後,我最近在看用R語言進行簡單機器學習的知識,主要參考了《機器學習-實用案例解析》這本書。 這本書是目前市面少有的,純粹以R語言為基礎講解的機器學習知識,書中涉及11個案例。分12章。作者備註以及程式碼部分都講得比較深。不過或許因為出書較早,在資料處理方面,他使用更多的是pl

R語言學習筆記,(1)基礎及向量操作

一、基礎部分(持續更新) 1、大小寫明感 2、source(“d:/test.R”):可以執行對應目錄下得test.R指令碼。R中\符號為轉義字元,所有目錄中需使用/或者\\.。 3、sink(“d:/out.txt”):將後續的輸出由終端轉向一個外部檔案,本例中為d;/o

商務數據分析報告--R語言--學習筆記1)-- ggplot2畫圖

商務 分享 數據分析 開始 lib r語言 都市 生存 pla 如今是只大三狗,做事3分鐘熱度。可以讀書的時間就僅剩下不到4個月的時間。不想落到無書可讀可的地步,還沒有一門生存下去的手段。故開始記錄學習筆記,希望能在都市存活,繁衍。 語言可視化是讓人理解的一個重要手段,也

R語言學習筆記-Error in ts(x):對象不是矩陣問題解決

dsm 為什麽 函數 時間序列 random ber post cto either 1、問題 在對時間序列進行擬合操作時,發生:Error in ts(x):對象不是矩陣的錯誤,而直接在arima()函數中使用時沒有問題的。 > sample<

R語言學習筆記(十一):廣義線性模型

學習筆記 Education 5.0 1.3 style only 可能性 div erro #Logistic 回歸 install.packages("AER") data(Affairs,package="AER") summary(Affairs) a

R語言學習筆記(十三):時間序列

abs 以及 stat max 時間 aic air ror imp #生成時間序列對象 sales<-c(18,33,41,7,34,35,24,25,24,21,25,20,22,31,40,29,25,21,22,54,31,25,26,35) tsal

R語言學習筆記(十六):處理缺失值

ima 結果 cti img dataset case prop .com log #識別缺失值 install.packages("VIM") data(sleep,package="VIM") #列出沒有缺失值的行 sleep[complete.case

R語言學習筆記(十七):data.table包中melt與dcast函數的使用

eas table variable mil pat efault ast 函數 pre melt函數可以將寬數據轉化為長數據 dcast函數可以將長數據轉化為寬數據 > DT = fread("melt_default.csv") > DT

R語言學習筆記—K近鄰算法

class 測試 als 概率 百分比 選擇 圖片 text false K近鄰算法(KNN)是指一個樣本如果在特征空間中的K個最相鄰的樣本中的大多數屬於某一個類別,則該樣本也屬於這個類別,並具有這個類別上樣本的特性。即每個樣本都可以用它最接近的k個鄰居來代表。KNN算法適

R語言學習筆記之三

結構 urn padding 效果 rand html 創建 字符 pri 僅用於記錄R語言學習過程: 內容提要:條件與循環 正文: 格式: 條件 ü if (條件) 執行的程序 else ü if (條件) {函數體 (分行,或者用;隔開) } else 返回值 ü

R語言學習筆記之五

常用 right 規則 如同 include 順序 rect amp 數據 摘要: 僅用於記錄R語言學習過程: 內容提要: 數據排序:sort()函數、rank()函數、order()函數; 長寬型數據的轉換:stack()函數、reshape()函數、reshape2擴展

R語言學習筆記之七

head ace row any type 分析 min 記錄 ted 摘要: 僅用於記錄R語言學習過程: 內容提要: 缺失值的識別與處理; 異常值與重復值的處理 正文: 缺失值的識別與處理 導讀: > x <- c(1,2,3,NA,NA,4)

C語言學習筆記-1.(資料表示和輸出)

C裡面的資料表示和輸出很重要.所以在此記下一些平時會用的東西. 1.系統自帶輸出八進位制和十六進位制(整數): 輸出八進位制:%o             輸出帶字首的八進位制:%#o 輸出十六進位制:%x 

R語言學習筆記(一)

什麼是R語言? R是用於統計分析、繪圖的語言和操作環境。R是屬於GNU系統的一個自由、免費、原始碼開放的軟體,它是一個用於統計計算和統計製圖的優秀工具。 R語言的發展歷史: R是統計領域廣泛使用的誕生於1980年左右的S語言的一個分支。可以認為R是S語言的一種實現。而S語言是

R語言學習筆記(二)——迴歸分析

什麼是迴歸? 迴歸是指研究某一個變數(稱為因變數)與一個或多個變數(稱為自變數或解釋變數)之間的相互依賴關係,或者說用自變數解釋因變數的變化,進一步,對於自變數(在重複抽樣中)的給定值,估計或預測因變數的總體均值。 變數間的關係: (1)確定性關係或函式關係:研究的是確定現象

R語言學習筆記:choose、factorial、combn排列組合函式

一、總結 組合數:choose(n,k) —— 從n箇中選出k個 階乘:factorial(k) —— k! 排列數:choose(n,k) * factorial(k) 冪:^ 餘數:%% 整數商:%/% 列出所有組合數矩陣:combn(x,n) t(combn(x,n)) 轉置 二、具體

R語言學習筆記:sort、rank、order、arrange排序函式

  R語言中排序有幾個基本函式:sort()、rank()、order()、arrange() 一、總結   sort()函式是對向量進行從小到大的排序   rank()函式返回的是對向量中每個數值對應的秩   order()函式返回的值表示位置,依次對應的是向量的最小值、次小值、第三小值……最大值等

R語言學習筆記:sort、rank、order、arrange排序函數

排序。 bsp 個數 span 意義 data 二維 desc 表示   R語言中排序有幾個基本函數:sort()、rank()、order()、arrange() 一、總結   sort()函數是對向量進行從小到大的排序   rank()函數返回的是對向量中每個數值對應的