r語言提取cvs資料_乾貨|R語言生物資訊大資料分析基礎入門

阿新 • • 發佈：2021-01-03

R是一個自由、免費、開放的軟體。具有強大的資料處理能力，越來越多的科研工作者也開始使用R語言處理科研資料，發表論文、文章。

牛頓曾經說過：如果說我看得比別人更遠些，那是因為我站在巨人的肩膀上。而R語言就是“巨人的肩膀”。但對於很多不是生信專業出身，卻又需要 R 來統計及繪圖的科研小夥伴來說，熟練使用 R 還是一項具有難度的挑戰。今天介紹的R語言基礎入門，希望能幫助到大家。

良好的R使用習慣

R支援中文，但不好！建議用全英文環境。
R語言具有嚴格的符號與語法控制，建議使用純文字編輯工具編寫R程式碼(注意中文符號)。
使用R時，要先設定工作目錄(getwd(), setwd())。
R可以使用Tab鍵自動補齊命令列。

設定R預設啟動項

file.edit('~/.Rprofile')#bioconductoroptions(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")#CRANoptions(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")

R包管理

install.packages("ggplot2")  安裝R包library(ggplot2)  載入R包update.packages()  將所有的包進行更新

更新R版本

install.packages("installr")require(installr)updateR()

R中的資料物件與資料操作

賦值與註釋

a = 2  # R中對變數的名字大小寫敏感，a與A是不同的a a b c

資料物件

標量
向量
因子
矩陣
陣列
列表
資料框

資料物件通常有三個屬性：型別、值、變數名稱

舉例

標量

a a = 3.14m x TURE -> y> y[1]  TURE> x[1]  FALSE

向量

a 1,b "one",c # 使用函式rep(), seq(), ":"生成向量d 2,times=> d[1] 2 2 2 2e from=> e[1]  3  6  9 12 15 18 21f 1:> f [1]  1  2  3  4  5  6  7  8  9 10# 向量提取元素> a[1][1] 1> a[c(1,5)][1] 1 5> a[1:3][1] 1 2 3> a[a<5][1] 1 2 3 4  # 通過判斷來提取元素> a[a>5][1]  6  7  8  9 10> a[-c(1,5)][1]  2  3  4  6  7  8  9 10   # 去除向量中的元素a[5] 12> a [1]  1  2  3  4 12  6  7  8  9 10  #替換元素a 12,> a [1]  1  2  3  4  5 12  6  7  8  9 10   # 新增元素

因子

# 因子是一種特殊型別的字元型向量# 建立一個字元向量或整數向量# 使用 factor()函式將其轉為因子b "one",b > b[1] one   two   threeLevels: one three two

矩陣

矩陣是一個二維陣列函式matrix()用於建立矩陣y 1:> y     [,1] [,2] [,3] [,4][1,]    1    6   11   16[2,]    2    7   12   17[3,]    3    8   13   18[4,]    4    9   14   19[5,]    5   10   15   20y 1:> y     [,1] [,2] [,3] [,4][1,]    1    2    3    4[2,]    5    6    7    8[3,]    9   10   11   12[4,]   13   14   15   16[5,]   17   18   19   20

資料框

patientID age status patientDate > patientDate  patientID age   status1         1  25     poor2         2  34 improved3         3  28     poor4         4  52     good> NCBIdata   Year BasePairs1  1991      11002  1992      12003  1993      13004  1994      14005  1995      15006  1996      16007  1997      17008  1998      18009  1999      190010 2000      2000# 按照條件提取> NCBIdata[NCBIdata$Year>1998,]   Year BasePairs9  1999      190010 2000      2000 NCBIdata[NCBIdata$Year>1990 & NCBIdata$BasePairs>1700,]   Year BasePairs8  1998      18009  1999      190010 2000      2000> NCBIdata[,c("Year")] [1] 1991 1992 1993 1994 1995 1996[7]1997199819992000

列表

rec "LiMing",age=> rec$`name`[1] "LiMing"$age[1] 18$scores[1] 85 76 90

R中的基礎函式及程式設計

函式形式：函式(輸入資料，引數=)
平均值：mean(x，trim=0，na.rm =FALSE，...)
線性模型：lm(y~x，data=test)

R字元資料操作函式

字符合並

>paste("abc","bc")[1] "abc bc">paste("abc","bc",sep="")[1] "abcbc"

字元取長度

>nchar("abcccc")[1] 6

字元取子集

> substr("abcdef",2,3)[1] "bc"> substring("abcdef", 3)[1] "cdef"substring("abcdef", 1:6, 1:6)[1] "a" "b" "c" "d" "e" "f"> substr(rep("abcdef", 4), 1:4, 4:5)[1] "abcd" "bcde" "cd"   "de"

程式設計基礎

函式名 {
異常處理;
表示式(迴圈/判別);
return(返回值);
}

輸入直角三角形的兩個邊，求斜邊長rcal function(x,y){      z 2 + y^      result       return(result)}rcal(3,4)

流程控制 if

if (條件)表示式，或if (條件)表示式1 else 表示式2

p = 0.03if (p < = 0.05) {      print("p <= 0.05!")} else {      print("p > 0.05!")}x = 3y if (x==2) x

條件與邏輯運算

判斷相等 x==y
判斷小於等於 x<=y
判斷大於等於 x>=y
邏輯“與”運算 x && y
邏輯“或”運算 x || y
邏輯“非”運算 !x
向量的邏輯“與” x & y
向量的邏輯“或” x | y

迴圈 for，while

for (i in 1:10)  print (i)a for (i in 1:10){      a }> a[1] 10i while (i <10) { print (i); i

資料的輸入與輸出

read.table()read.csv()write.table()write.csv()

免責宣告：來源於網路，僅供學習、交流使用，不具有任何商業用途，版權歸原作者所有，如有問題請及時聯絡我們以作處理。本宣告未涉及的問題參見國家有關法律法規，當本宣告與國家法律法規衝突時，以國家法律法規為準。

•END•

r語言提取cvs資料_乾貨|R語言生物資訊大資料分析基礎入門

技術標籤：r語言提取cvs資料 R是一個自由、免費、開放的軟體。具有強大的資料處理能力，越來越多的科研工作者也開始使用R語言處理科研資料，發表論文、文章。

一對一的表怎麼插入資料_怎麼快速插入 1000 W條資料,用時最短

技術標籤：一對一的表怎麼插入資料 package com.khd.project.order; import java.sql.Connection;

下c語言按q退出_一道C語言貪吃蛇小bug，求大神解惑，急！

技術標籤：下c語言按q退出這個程式執行後不顯示蛇的食物，成了一條長不大的蛇了(C語言作業，還有一天要交，我...)

語言隨機數不變_用c語言做最簡易的2048小遊戲

技術標籤：語言隨機數不變 1.最基本的要求掌握if-else語句，迴圈，二維陣列，函式。

c post請求資料_額外話題： post請求的資料序列化小問題

技術標籤：c post請求資料本來想第一篇文章寫演算法，或者風控模型之類的內容，先寫了這個吧，實際工作中遇到的小問題

大資料都具體哪些價值如何學好大資料開發

　　大資料都具體哪些價值？如何學好大資料開發？對於大資料技術的學習，我們都知道，主要還是服務於企業，為企業創造更大的價值，而你的價值也是隨之增長的。想要挖掘大資料的更大價值，需要這三步的緊密結

01大資料概述 2、為什麼要學習大資料技術？

1、門檻大資料比 Java 高一點，除了對資料庫的操作之外，還需要學習大資料生態的東西，分散式、數倉、中介軟體等知識。大資料比機器學習低一些，不用會太多的演算法和高等數學知識，這是需要長時間的磨練和沉澱

可能是個生物資訊學資料超市吧

biomaRt這個包很久以前我就給它寫過教程(點選閱讀)，但是排版不好，可讀性很差，所以我用R Markdown重新來一個。當然了，它本身有官方的英文版教程(點選閱讀)，我在翻譯的基礎上面，加入了自己的理解，下面是正文：

tushare 金融資料獲取（R語言版）

在上次 tushare正確爬取指數資料文章後，看到後臺有人留言說是希望能分享一個R語言版，那麼好，你們要的R語言版今天來了。首先，R語言只支援tushare pro，不支援tushare，因此在使用tushare獲取資料之前，需要註冊後

大資料分析R語言tidyverse資料清洗工具教程

　　凌亂的資料集無處不在。如果要分析資料，不可避免地需要清理資料。在大資料分析R語言tidyverse資料清洗工具教程中，我們將研究如何使用R和一些漂亮的tidyverse工具來做到這一點。

大資料分析為什麼學習R程式語言

　　學習大資料分析技能的人越來越多，這是一個好的現象，現在大資料分析師的市場需求很大，你學習大資料分析那很棒!AAA教育提供大量的大資料分析課程。為什麼大資料分析要專門學習R程式設計?

r k-means 分類結果_別再自己看電泳結果了！通過R語言進行影象識別分類

技術標籤：r k-means 分類結果本文靈感來源於一篇人像識別的博文 https://blog.csdn.net/weixin_43786013/article/details/90266409

R語言讀CSV、txt檔案方式以及read.table read.csv 和readr（大資料讀取包）

首先準備測試資料*(mtcars) 分別為CSV. TXT read.table 預設形式讀取CSV（×）與TXT(效果理想)

資料分享|R語言對論文作者研究機構、知識單元地理空間資料視覺化

全文連結：http://tecdat.cn/?p=30810 原文出處：拓端資料部落公眾號地圖本身就是視覺化的產品,並在發展過程中形成了一系列的理論與方法。這些都自然地會成為地理空間資料視覺化技術的基礎。地圖學也因視覺化方法

千牛包表包下載_探索R中表包的gt語法

千牛包表包下載 I love migrittr’s forward-pipe %>% operator. IMO, it is just the one of the most fitting, useful and natural, almost reflex like operator in all programming. In the pa

乾貨丨大資料分析語言DolphinDB指令碼語言概述

開發大資料應用，不僅需要能支撐海量資料的分散式資料庫，能高效利用多核多節點的分散式計算框架，更需要一門能與分散式資料庫和分散式計算有機融合、高效能易擴充套件、表達能力強、滿足快速開發和建模需要的程式

github安裝_R語言筆記——直接從GITHUB安裝R軟體包

技術標籤：github安裝r語言which 本個專題將介紹R語言的一些基本技能和實用技巧。在R中，您可以使用2-3行簡單的程式碼直接從Github安裝軟體包。

r語言柱狀圖加星號_R語言if else條件句

技術標籤：r語言柱狀圖加星號 if else 條件句 if else 條件句在任何程式語言中都非常重要，包括R。本教程將針對初學者，探討如何在R語言中編寫基本的if else條件句。

ambari安裝hive時連線失敗_使用R連線到Hive

技術標籤：ambari安裝hive時連線失敗基礎材料需要的R包有三個，分別為： rJavaDBIRJDBC

【計理05組01號】R 語言基礎入門

部落格推行版本更新，成果積累制度，已經寫過的部落格還會再次更新，不斷地琢磨，高質量高數量都是要追求的，工匠精神是學習必不可少的精神。因此，大家有何建議歡迎在評論區踴躍發言，你們的支援是我最大的動力，

r語言提取cvs資料_乾貨|R語言生物資訊大資料分析基礎入門

R是一個自由、免費、開放的軟體。具有強大的資料處理能力，越來越多的科研工作者也開始使用R語言處理科研資料，發表論文、文章。

良好的R使用習慣

設定R預設啟動項

R包管理

更新R版本

R中的資料物件與資料操作

賦值與註釋

資料物件

舉例

R中的基礎函式及程式設計

R字元資料操作函式

程式設計基礎

流程控制 if

條件與邏輯運算

迴圈 for，while

資料的輸入與輸出

相關推薦