R教材4 高階資料管理

阿新 • • 發佈：2018-11-26

數值與字元處理函式

1. 數學函式，物件非單個數值時，會作用於每個數值
  1. 絕對值abs()
  2. 平方根sqrt()
  3. 舍入小數round(,digits=)
  4. 對數
    1. log(x,base=n)以n為底
    2. log()以e為底
    3. log10()以10為底
  5. 指數exp(x)，以e為底指數
2. 統計函式na.rm=T，計算時移除NA；trim=0.05，去除了前後5%的資料再計算，當沒有足夠的資料時，不會去掉極值
  1. 均值mean()
  2. 標準差sd()
  3. 方差var()
  4. 分位數quantile(x,probs=c())，probs分位點
  5. 中心化、標準化scale(x,center=T,scale=T)，標準化即z分數
3. 概率函式
  1. 不同函式的字首
    1. 密度函式d，即分佈的y值
    2. 分佈函式p，求面積，p-(z)，標準分佈下的面積
    3. 分位數函式q，q-(0.9分位點,……)，某分佈下的分位點0.9等
    4. 生成隨機數r
  2. 分佈
    1. 指數分佈exp
    2. 對數分佈logis
    3. 正態分佈norm
    4. t分佈t
    5. 均勻分佈unif
  3. 設定隨機數種子
    1. set.seed(x)……，x種子下的隨機函式結果
4. 字元處理函式
  1. 字元數量nchar()
  2. 提取或替換字元substr(物件,from,to)
  3. 在X中搜索模式grep(pattern,x,fixed=F)，fixed=F模式為正則表示式，T模式為文字字串
  4. 連線字串paste(……,sep="")，sep每個連線的分隔
  5. toupper、tolower，大小寫轉換
5. 其他函式
  1. 生成序列seq(from,to,by)
  2. 重複rep(x,n)
  3. 將連續變數分割為n個水平的因子cut(x,n)，ordered_result=T建立有序因子
  4. 建立美觀的分割點pretty(x,n)，選取n+1個等間距的取整值
  5. 連線……中的物件，並將其輸出到螢幕或檔案上cat(……,file="",append=F)，cat輸出連線物件會對每個物件用空格分開，甚至是.，所以作為句號必須在前面加上\b
6. 函式用於矩陣和資料框：
  1. 針對維度apply(x,margin,FUN)，margin=1表示行，2表示列
  2. split(物件,分組屬性)，返回是列表；可以多重分組，用list()來標明
  3. apply：lapply、sapply、tapply只能針對一個屬性的分組進行函式
    1. apply(X, MARGIN, FUN, ...)，x是陣列、矩陣（資料框）；margin=1|2，對行|列操作；fun函式
    2. lapply(split,FUN)結合split使用，lapply針對列表中的每個元素使用fun，可以沒有margin，返回列表
    3. sapply同上，返回的是更緊湊的格式
    4. tapply(物件,分組屬性,FUN)簡化了split函式，返回列表
7. 控制流
  1. for(var in seq(from,to,by)) {}
  2. while(cond) {}
  3. 條件執行
    1. if(cond) …… else ……
    2. ifelse(cond,T-stat,F-stat)，R語言特有，輸出結果為向量，對每個向量中的元素進行判斷
    3. switch(i,……)，……是i的可能值繫結的語句
  4. 使用者自編函式最好有一個表示式來捕獲錯誤輸入；所有的輸出只能在函式中才有意義，所以用return
8. 整合與重構
  1. 轉置t()
  2. 整合aggregate(x, by, FUN, ..., )，x可以是多個屬性的資料，by分組依據（相同分組屬性值為一組），FUN是用來計算新觀測中的值，by必須是list形式by=list()，by中的變數可以可以自定義名稱；或者aggregate(a~b, x, FUN, ..., )，b為標識，a為整合量
  3. reshape2包
    1. 融合melt(x,id=c())，id即主鍵，結果是主鍵下的屬性和屬性值
    2. 重鑄dcast(melt,formula,fun.aggregate)，melt為已融合資料，formula為結果結構row1,……~col1,……，fun為資料整合函式（可選的）

R教材4 高階資料管理

數值與字元處理函式數學函式，物件非單個數值時，會作用於每個數值絕對值abs() 平方根sqrt() 舍入小數round(,digits=) 對數 log(

R語言高階資料管理

數學函式函式描述 abs(x) 絕對值 sqrt(x) 平方根 ceiling(x) 不小於x的最小整數 flo

R語言學習（五）高階資料管理

（一）數值和字元處理函式數學函式：統計函式：輸入help（）可以檢視函式的具體用法 z <- mean(x) z <- mean(x,trim=0.05,na.rm=TRUE) ;;丟棄最大最小百分之5後的截尾平均書均值與標準

利用R語言進行基本資料管理

####建立leadership資料框 manager <- c(1, 2, 3, 4, 5) date <- c("10/24/08", "10/28/08", "10/1/08", "10/12/08", "5/1/09") country <- c("US", "US", "

R中的基本資料管理

目錄 1、引例 2、建立新變數 3、變數的重編碼 4、變數的重新命名 5、缺失值 6、日期值 7、資料排序 8、資料集的合併 9、資料取子集 1、引例現假設需要研究男性和女性在領導各自企業方式上的不同，為了很好地解答這個問題，我們可能需要各個方面的資

R教材3 資料管理

根據原物件建立新變數，物件=transform(物件,新變數) 變數的重編碼variable[condition]<-expression，變數的下標運算子設定條件，當condition為T時則執行賦值；within(物件,{新變數[原變數的判斷條件]=新值})，建立新物件，{}內

R入門<三>-R語言實戰第4章基本資料管理摘要

入門書籍：R語言實戰進度：1-4章摘要： 1）實用的包 forecast:用於做時間序列預測的，有auto.arima函式 RODBC:可以用來讀取excel檔案。但據說R對csv格式適應更加良好，相應的匯入匯出均較為方便（read.table, write等） reshape：目前用到ren

R語言基本資料管理

建立新變數並整合到原來的資料框中： my_data <- transform(my_data, sum_x = x1 + x2, mean_x = (x1 + x2)/2) 變數的重編碼： lead

【Linux】【Services】【SaaS】Docker+kubernetes（4. 用ansible管理機器和軟件）

實現 service SDR https 輸出公司 keygen /etc slave 1. 簡介 1.1. 公司環境使用的puppet，但是我更喜歡ansible，原因有二，第一，我是紅帽的忠粉：），第二，我對python比較熟悉 1.2. ansible官方網站：ht

R語言-基本數據管理

tac math row 日期類由於 format tile 格式轉換運算目的:學會對原始的數據集進行整理(日期,缺失值,變量創建等),然後通過修改後的數據集可以更有針對性的來分析數據案例:分析男性和女性經理人在領導自己企業的不同　　問題:1.處於管理崗的男性和女

docker-4.數據管理

clas data pan mes 容器一個只讀存在 class 數據卷是一個可供一個或多個容器使用的特殊目錄，它繞過文件系統，可以提供很多有用的特性：數據卷可以在容器之間共享和重用對數據卷的修改會立馬生效對數據卷的更新，不會影響鏡像數據卷默認會一直存在，即

CentOS上安裝Redmine-3.4項目管理軟件

redmine1.說明redmine和ruby以及rails的版本號關系如下： Redmine版本支持Ruby版本使用Rails版本 4.0 (即將到來的) ruby 2.2,2.3,2.4 R

2018-4-17Linux系統管理(18)(19)網絡配置命令及網絡配置文件

Linux 系統管理在前面的章節當中我們講述了計算網絡通信的基礎知識，介紹網絡的拓撲結構類型及對於Linux來說的網絡屬性如何進行相關配置，而後有介紹了TCP/IP的協議棧，而這個協議棧是計算機真正使用的協議棧，以分層的概念將復雜問題進行切割，每層都有其相關的協議，都能夠獨立且相互調用可以協作完

4.用戶管理

use get pub 字符 pda phone ems 請求 _id 4.用戶管理接口 3.1.添加老師老師可以自己註冊，也可以有後臺管理添加。註冊時只需要提供姓名、手機號、密碼即可。註冊完成後可以在個人中心修改自己的詳細信息。請求 /users/addpubs

[4]supervisor使用管理:實現對異常中斷子進程的自動重啟(以mysql為例)

grep -v rem iad apple mysq round true com 子進程實現進程服務管理，supervisort監聽到進程死後，會自動將它重新拉起，很方便的做到進程自動恢復的功能，不再需要自己寫shell腳本來控制安裝過程1、到官網下載最新版本，解壓編譯

土木工程師資料管理系統EngineerCMS

p s http sys height 協同 one adding In soft 工程師的一輩子最值錢的是經驗和資料資源，活生生的資料，整合得好，應付工作得心應手。而一些大型的資料管理系統不適合單機使用。EngineerCMS這款是專門為工程師量身打造的，可用於單機，也可

習題 14.3 學校的人事部門儲存了有關學生的部分資料（學號、姓名、年齡、住址），教務部門也儲存了學生的另外一些資料（學號、姓名、性別、成績），兩個部門分別編寫了本部門的學生資料管理程式，其中都用。。

C++程式設計（第三版）譚浩強習題14.3 個人設計習題 14.3 學校的人事部門儲存了有關學生的部分資料（學號、姓名、年齡、住址），教務部門也儲存了學生的另外一些資料（學號、姓名、性別、成績），兩個部門分別編寫了本部門的學生資料管理程式，其中都用了Student作為類名。現在

【兩行命令】R語言讀取excel資料

安裝庫安裝xlsx install.packages("xlsx") 使用 library(xlsx) ray = read.xlsx('D:/Code/R/Data in Excel/Chapter 8/gamma-ray.xls',1) 後面的引數，第一個放

Linux運維入門～4.輸入輸出管理與vim管理

今天我們來聊一下輸入輸出管理與vim 一輸入輸出管理 1.輸出管理在Linux運維過程中，我們會需要管理輸出的資訊，或是儲存到檔案，或是呼叫部分資訊那我們舉個例子：在普通使用者student下，利用find指令檢視/etc 下檔案指令：find

R語言實驗：資料探索

資料介紹使用銀行對資產進行評估的資料bank-data.csv，資料裡有12個屬性，分別是id,age,sex,region,income,married,children, car, save_act, current_act,

R教材4 高階資料管理

相關推薦