cat SRR_Acc_List.txt | while read id; do (prefetch  ${id} &);done


# 批量轉換sra到fq格式
ls /public/project/RNA/airway/sra/*  | while read id; do ( nohup fastq-dump --gzip --split-3 -O ./ ${id} & ); done

下載的資料：

[sunchengquan 15:45:09 /data/Data_base/test_tmp/RNA_seq_practice/chrX_data/samples]
$ ll
總用量 1.8G
-rwxr-xr-x 1 sunchengquan sunchengquan  88M 1月  15 2016 ERR188044_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  88M 1月  15 2016 ERR188044_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  84M 1月  15 2016 ERR188104_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  85M 1月  15 2016 ERR188104_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan 108M 1月  15 2016 ERR188234_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan 109M 1月  15 2016 ERR188234_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  59M 1月  15 2016 ERR188245_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  60M 1月  15 2016 ERR188245_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  65M 1月  15 2016 ERR188257_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  66M 1月  15 2016 ERR188257_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  39M 1月  15 2016 ERR188273_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  39M 1月  15 2016 ERR188273_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  88M 1月  15 2016 ERR188337_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  88M 1月  15 2016 ERR188337_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  63M 1月  15 2016 ERR188383_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  63M 1月  15 2016 ERR188383_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  86M 1月  15 2016 ERR188401_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  87M 1月  15 2016 ERR188401_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  56M 1月  15 2016 ERR188428_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  56M 1月  15 2016 ERR188428_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  70M 1月  15 2016 ERR188454_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  70M 1月  15 2016 ERR188454_chrX_2.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  75M 1月  15 2016 ERR204916_chrX_1.fastq.gz
-rwxr-xr-x 1 sunchengquan sunchengquan  75M 1月  15 2016 ERR204916_chrX_2.fastq.gz

資料質量控制

reads質量評估軟體：fastqc生成質控報告，multiqc將各個樣本的質控報告整合為一個。

reads質量控制軟體：prinseq，cutadapt，trimmomatic,trim_galore

檢視qc.sh


#!/usr/bin/env bash

set -e

settings(){
        samples=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/samples
        if test -w $samples;then
                mkdir -p {$samples/qc,$samples/cleandata/qc}   
        else
                echo "沒有寫入許可權"
        fi

}


thread(){
        tmp_fifofile="/tmp/$$.fifo" #指令碼執行的當前程序ID號作為檔名 
    mkfifo "$tmp_fifofile" 
    exec 6<>"$tmp_fifofile"  #將fd6指向fifo型別
    rm $tmp_fifofile
    thread_num=$1 # 此處定義執行緒數
    for((i=0;i<$thread_num;i++));do 
        echo 
    done >&6 # 事實上就是在fd6中放置了$thread個回車符
    $2 6 $3
    exec 6>&- # 關閉df6
}


qc(){
        source activate RNA
        printf "[%s %s %s %s %s %s]::資料質量評估\n" $(echo `date`)
        start=$(date +%s.%N)
        list=$(find $2 -name *q\.gz)
        file_num=`ls -l $2/qc|wc -l`
        if [ $file_num -lt 2 ];then
                for i in $list;do
                        read -u$1
                        {
                        name=`awk -v each=$i 'BEGIN{split(each,arr,"/");l=length(arr);print arr[l]}' `
                        fastqc  $i -o $2/qc  &>> $2/qc/qc.log
                        printf "[%s %s %s %s %s %s]::%s質量評估完成\n" $(echo `date`) $name
                        echo >&$1 
                        } &
                done && wait

                multiqc -d $2/qc -o $2/qc 
                dur=$(echo "($(date +%s.%N) - $start)/60" | bc -l) 
                printf "[%s %s %s %s %s %s]::資料質量評估耗時%.2f分鐘\n" $(echo `date`) $dur
        fi
        source deactivate RNA
}

trim_qc(){
        printf "[%s %s %s %s %s %s]::資料質量控制\n" $(echo `date`)
        source activate RNA
        start=$(date +%s.%N)
        dir=$samples/cleandata
        find $samples -name *1?f*q?gz|sort >$dir/1
        find $samples -name *2?f*q?gz|sort >$dir/2
        paste -d ":" $dir/1 $dir/2  > $dir/config && rm $dir/1 $dir/2
        file_num=`ls -l $dir|wc -l`
        
        if [ $file_num -lt 3 ];then
                for id in `cat $dir/config`;do
                        read -u$1
                        fq1=$(echo $id|cut -d":" -f1)
                        fq2=$(echo $id |cut -d":" -f2)
                        base_name=$(basename $fq1)
                        name=`awk -v each=$base_name 'BEGIN{split(each,arr,"_");print arr[1]}' ` 
                        {
                        trim_galore -q 25 --phred33 --length 25 --stringency 3 --paired -o $dir $fq1 $fq2 &> $dir/trim.log
                        printf "[%s %s %s %s %s %s]::%s質量控制完成\n" $(echo `date`) $name
                        echo >&$1
                        } &
                done && wait 
                dur=$(echo "($(date +%s.%N) - $start)/60" | bc -l)
                printf "[%s %s %s %s %s %s]::資料質量控制耗時%.2f分鐘\n" $(echo `date`) $dur
        fi
        source deactivate RNA
}


settings
thread 6 qc $samples
thread 3 trim_qc 
thread 6 qc $samples/cleandata

Tophat –> Cufflink –> Cuffdiff

參考文獻：Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks

流程圖：
在這裡插入圖片描述

手動安裝相關軟體

我們已經使用bioconda安裝相關的軟體，現在手動安裝一下，本流程所需要的軟體

下載並安裝比對軟體bowtie2
cd ~/local/app
curl -OL http://downloads.sourceforge.net/project/bowtie-bio/bowtie2/2.2.4/bowtie2-2.2.4-linux-x86_64.zip
unzip bowtie2-2.2.4-linux-x86_64.zip

把比對軟體以及相關程式連結到bin資料夾
ln -s ~/local/app/bowtie2-2.2.4/bowtie2 ~/bin/
ln -s ~/local/app/bowtie2-2.2.4/bowtie2-align* ~/bin/
ln -s ~/local/app/bowtie2-2.2.4/bowtie2-build ~/bin/

安裝tophat2
cd ~/local/app/
curl -OL http://ccb.jhu.edu/software/tophat/downloads/tophat-2.1.1.Linux_x86_64.tar.gz
tar zxvf tophat-2.0.13.Linux_x86_64.tar.gz
cd ~/bin/
vi tophat
#!/usr/bin/env bash
python2 ~/local/app/tophat-2.1.1.Linux_x86_64/tophat [email protected]
chmod 755 tophat
儲存退出

#註釋檔案
cd /data/Data_base/test_tmp/RNA_seq_practice/chrX_data/genes
curl -L ftp://ftp.ensembl.org/pub/release-77/gtf/homo_sapiens/Homo_sapiens.GRCh38.77.gtf.gz > hg38.gtf.gz
gunzip *.gz
cat hg38.gtf | awk ' $1 =="X" { print $0 }' > chr_X.gtf


安裝cufflinks
cd ~/local/app
curl -OL http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.1.1.Linux_x86_64.tar.gz
tar zxvf cufflinks-2.1.1.Linux_x86_64.tar.gz

ln -fs ~/local/app/cufflinks-2.1.1.Linux_x86_64/cufflinks ~/bin
ln -fs ~/local/app/cufflinks-2.1.1.Linux_x86_64/cuffdiff ~/bin
ln -fs ~/local/app/cufflinks-2.1.1.Linux_x86_64/gtf_to_sam ~/bin
ln -fs ~/local/app/cufflinks-2.1.1.Linux_x86_64/cuffcompare ~/bin
cd ~/bin
vi cuffmerge
#!/usr/bin/env bash
python2 ~/local/app/cufflinks-2.1.1.Linux_x86_64/cuffmerge [email protected]
chmod 755 cuffmerge

流程程式碼

#!/usr/bin/env bash

set -ue

settings(){
        samples=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/samples
        index=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/genome/index
        output=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/tophat+cuff
        if test -w $(dirname $output) &&  test -w $(dirname index);then
                mkdir -p {$index/bowtie,$output/1_tophat,$output/2_cufflinks,$output/3_cuffdiff}
        fi
        cuffdiff=$output/3_cuffdiff
        indexes=$index/bowtie/chrX
        genome=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/genome/chrX.fa
        gene=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/genes/chrX.gtf
}


thread(){
    tmp_fifofile="/tmp/$$.fifo" 
    mkfifo "$tmp_fifofile" 
    exec 6<>"$tmp_fifofile"  
    rm $tmp_fifofile
    thread_num=$1 
    for((i=0;i<$thread_num;i++));do 
        echo 
    done >&6 
    $2 6 
    exec 6>&- 
}


index(){
        printf "[%s %s %s %s %s %s]::建立索引bowtie2-build\n" $(echo `date`)
        start=$(date +%s.%N)
        file_num=`ls -l $index/bowtie|wc -l`    
        source activate RNA
        base_name=$(basename $genome)
    name=`awk -v each=$base_name 'BEGIN{split(each,arr,".");print arr[1]}' ` 
        if [ $file_num -lt 2 ];then
                bowtie2-build -f $genome $index/bowtie/$name &> $index/bowtie/index.log
                ln -s $genome $index/bowtie/$basename
                dur=$(echo "($(date +%s.%N) - $start)/60" | bc -l)
                printf "[%s %s %s %s %s %s]::建立索引耗時%.2f分鐘\n" $(echo `date`) $dur
        fi
        source deactivate RNA
}


mapping(){
        printf "[%s %s %s %s %s %s]::與參考基因組比對tophat\n" $(echo `date`)
        start=$(date +%s.%N)
        dir=$output/1_tophat
        find $samples/cleandata -name *1?f*q.gz|sort > $dir/1
        find $samples/cleandata -name *2?f*q.gz|sort > $dir/2
        paste -d ":" $dir/1 $dir/2  > $dir/config && rm $dir/1 $dir/2
        file_num=`ls -l $dir|wc -l`
        source activate RNA
        if [ $file_num -lt 3 ];then
                for id in $(cat $dir/config);do
                        fq1=$(echo $id|cut -d":" -f1)
                        fq2=$(echo $id |cut -d":" -f2)
                        name=`awk -v each=$(basename $fq1) 'BEGIN{split(each,arr,"_");print arr[1]}' ` 
                        read -u$1
                        {
                        tophat -p 8 -G $gene -o $dir/$name $indexes $fq1 $fq2 &>> $dir/mapping.log
                        printf "[%s %s %s %s %s %s]::%s比對完成\n" $(echo `date`) $name
                        echo >&$1
                        } &
                done && wait
                dur=$(echo "($(date +%s.%N) - $start)/60" | bc -l)
                printf "[%s %s %s %s %s %s]::比對耗時%.2f分鐘\n" $(echo `date`) $dur
        fi
        source deactivate RNA
}


assemble(){
        printf "[%s %s %s %s %s %s]::轉錄本組裝和定量cufflinks\n" $(echo `date`)
        start=$(date +%s.%N)
        dir=$output/2_cufflinks
        file_num=`ls -l $dir|wc -l`
        source activate RNA
        if [ $file_num -lt 3 ];then
                for id in $(cat $output/1_tophat/config);do
                        fq1=$(echo $id|cut -d":" -f1)
                        name=`awk -v each=$(basename $fq1) 'BEGIN{split(each,arr,"_");print arr[1]}' ` 
                        read -u$1
                        {
                        cufflinks -p 8 -g $gene -o $dir/$name $output/1_tophat/$name/accepted_hits.bam &> $dir/$name.log
                        printf "[%s %s %s %s %s %s]::%s轉錄本組裝完成\n" $(echo `date`) $name
                        echo >&$1
                        } &
                done && wait
                dur=$(echo "($(date +%s.%N) - $start)/60" | bc -l)
                printf "[%s %s %s %s %s %s]::轉錄本組裝耗時%.2f分鐘\n" $(echo `date`) $dur
        fi
        source deactivate RNA

}


merge(){
        printf "[%s %s %s %s %s %s]::轉錄本合併cuffmerge\n" $(echo `date`)
        start=$(date +%s.%N)
        dir=$output/2_cufflinks
        find $dir -name *transcripts?gtf|sort > $dir/assemblies.txt
        source activate RNA
        if [ ! -d $dir/merged_asm ];then
                cuffmerge -p 8 -o $dir/merged_asm -g $gene -s $genome $dir/assemblies.txt &> $dir/cuffmerge.log
                dur=$(echo "($(date +%s.%N) - $start)/60" | bc -l)
                printf "[%s %s %s %s %s %s]::轉錄本合併耗時%.2f分鐘\n" $(echo `date`) $dur
        fi
    source deactivate RNA

}


diff(){
        printf "[%s %s %s %s %s %s]::差異分析cuffdiff\n" $(echo `date`)
        start=$(date +%s.%N)
        dir=$output/3_cuffdiff
        S1=$output/1_tophat/ERR188245/accepted_hits.bam;S2=$output/1_tophat/ERR188428/accepted_hits.bam;S3=$output/1_tophat/ERR188337/accepted_hits.bam
        S4=$output/1_tophat/ERR204916/accepted_hits.bam;S5=$output/1_tophat/ERR188234/accepted_hits.bam;S6=$output/1_tophat/ERR188273/accepted_hits.bam
        S7=$output/1_tophat/ERR188401/accepted_hits.bam;S8=$output/1_tophat/ERR188257/accepted_hits.bam;S9=$output/1_tophat/ERR188383/accepted_hits.bam
        S10=$output/1_tophat/ERR188454/accepted_hits.bam;S11=$output/1_tophat/ERR188104/accepted_hits.bam;S12=$output/1_tophat/ERR188044/accepted_hits.bam
        
        file_num=`ls -l $dir|wc -l`
        source activate RNA
        if [ $file_num -lt 3 ];then
                cuffdiff -p 8 -b $genome -o $dir -L Female,Male -u $output/2_cufflinks/merged_asm/merged.gtf $S1,$S2,$S3,$S4,$S5,$S6 $S7,$S8,$S9,$S10,$S11,$S12 &> $dir/cuffdiff.log
                dur=$(echo "($(date +%s.%N) - $start)/60" | bc -l)
                printf "[%s %s %s %s %s %s]::差異分析cuffdiff耗時%.2f分鐘\n" $(echo `date`) $dur
        fi
        source deactivate RNA
}

expression_matrix(){
        dir=$output/3_cuffdiff
        expr=$dir/gene_exp.diff
        ##篩選出下調的基因（log2_fold_change < -2 & pvalue < 0.001）
        awk '{if(($10<-2)&&($11<0.001))print $3"\t"$8"\t"$9"\t"$10}' $dir/gene_exp.diff | grep -v 'inf' > $dir/down.txt
        ## 篩選出上調的基因（log2_fold_change > 2 & pvalue < 0.001
        awk '{if(($10>2)&&($11<0.001))print $3"\t"$8"\t"$9"\t"$10}' $dir/gene_exp.diff | grep -v 'inf' > $dir/up.txt
}


settings
index
thread 4 mapping
thread 4 assemble
merge
diff

Subread -> featureCounts -> DESeq2

流程程式碼

#!/usr/bin/env bash

set -ue

settings(){
        samples=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/samples
        index=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/genome/index
    output=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/subread+featurecounts
    if test -w $(dirname $output) &&  test -w $(dirname index);then
        mkdir -p {$index/subread,$output/1_subjunc,$output/2_featurecounts}   
    else
        echo "沒有寫入許可權"
    fi
        genome=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/genome/chrX.fa
    gene=/data/Data_base/test_tmp/RNA_seq_practice/chrX_data/genes/chr_X.gtf
        
}

thread(){
    tmp_fifofile="/tmp/$$.fifo" 
    mkfifo "$tmp_fifofile" 
    exec 6<>"$tmp_fifofile"  
    rm $tmp_fifofile
    thread_num=$1 
    for((i=0;i<$thread_num;i++));do 
        echo 
    done >&6 
    $2 6 
    exec 6>&- 
}

index(){
    printf "[%s %s %s %s %s %s]::建立索引subread-buildindex\n" $(echo `date`)
    start=$(date +%s.%N)
    file_num=`ls -l $index/subread|wc -l`   
    source activate RNA
        base_name=$(basename $genome)
        name=`awk -v each=$base_name 'BEGIN{split(each,arr,".");print arr[1]}' ` 
    if [ $file_num -lt 2 ];then
        subread-buildindex -o $index/subread/$name $genome &> $index/subread/index.log
    fi
    dur=$(echo "($(date +%s.%N) - $start)/60" | bc -l)
    printf "[%s %s %s %s %s %s]::建立索引耗時%.2f分鐘\n" $(echo `date`) $dur
    source deactivate RNA
}



mapping(){
        printf "[%s %s %s %s %s %s]::與參考基因組比對subjunc\n" $(echo `date`)
        start=$(date +%s.%N)
        dir=$output/1_subjunc
        find $samples/cleandata -name *1?f*q.gz|sort > $dir/1
        find $samples/cleandata -name *2?f*q.gz|sort > $dir/2
        paste -d ":" $dir/1 $dir/2  > $dir/config && rm $dir/1 $dir/2
        file_num=`ls -l $dir|wc -l`
        index_prefix=`awk -v each=$(basename $genome) 'BEGIN{split(each,arr,".");print arr[1]}' `
        source activate RNA
        if [ $file_num -lt 3 ];then
                for id in $(cat $dir/config);do
                        fq1=$(echo $id|cut -d":" -f1)
                        fq2=$(echo $id |cut -d":" -f2 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    轉錄組分析流程
       
 
  
  
 
 
  文章目錄
  
   分析流程概述
   下載測試資料
   資料質量控制
   Tophat –> Cufflink –> Cuffdiff
   
    手動安裝相關軟體
    流程程式碼
   
   Subread -> featureCounts 

  
 

    

    
    轉錄組分析---Hisat2+StringTie+Ballgown使用
       
 轉錄組分析---Hisat2+StringTie+Ballgown使用  
 (2016-10-10 08:14:45) 
 
  轉載▼
  
 
 
  
   
    
    標籤：  生物資訊學   轉錄組  
      
    
   
  
  

  
 

    

    
    轉錄組分析綜述A survey of best practices for RNA-seq data analysis
      轉錄組分析綜述 
 
 轉錄組   
 文獻解讀   
 Trinity   
 cufflinks 
 
 
 
  轉錄組研究綜述文章解讀
  
  
  今天介紹下小編最近閱讀的關於RNA-seq分析的文章，文章發在Genome Biology 上的A survey of  

  
 

    

    
    易生信九天的轉錄組分析培訓班總結
      
							
							
							易生信九天的轉錄組分析培訓班第一期伴隨著5個小時的考試在緊張中結束了。說是培訓，倒不如研討更確切些。在一個個問題的交流中學會轉錄組分析，效果遠大於一人講，自己練。

先分享兩張現場的照片





前兩天以集中講練為主，在講述了原理後，進行上機操作。大部分學員有 

  
 

    

    
    轉錄組差異表達分析小實戰（一）
      轉錄組差異表達分析小實戰（一） 
 Posted: 七月 28, 2017  Under: Transcriptomics  By Kai  no Comments 
 
 讀文獻獲取資料 
 文獻名稱：AKAP95 r 

  
 

    

    
    轉錄組差異表達分析小實戰（二）
      轉錄組差異表達分析小實戰（二） 
 Posted: 八月 14, 2017  Under: Transcriptomics  By Kai  no Comments 
 
 差異基因表達分析 
 我按照前面的流程轉錄組差 

  
 

    

    
    微生物組學數據分析工具綜述 | 16S+宏基因組＋宏病毒組＋宏轉錄組--轉載
      tag   rev   .com   key   頭腦風暴   報告   all   bsp   模塊   轉載：https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ
建立在高通量測序基礎上的微生物群落研究，當前主要有三大類：基於16S/18S/ITS等擴增子做物 

  
 

    

    
    總結實驗室對轉錄組及lncRNA資料分析的思路
      
                     繼師兄詳細地講述這個思路之後，我進行一個歸納總結（師兄說，首先要建立一個思想上的流程，再來糾結軟體、命令這些細節！！！！！！）

     首先你得了解 raw_data / 參考基因組  .fa / 註釋檔案 .gtf / 索引檔案 indexes（通過hisat 

  
 

    

    
    RNA_seq(1)植物轉錄組實戰（下）之DESeq2進行差異基因分析
      
							
							
							四、DESeq2差異基因分析

獲得reads-counts之後，我們就可以開展差異基因分析了。我們以subread中的featureCounts工具得到的counts_id.txt為例，來進行後續的差異基因分析。 
目前常見的差異基因分析工具有DESeq2、l 

  
 

    

    
    無參轉錄組GO、KEGG富集分析——diamond+idmapping+GOstats
      
                準備

（1）用無參轉錄組分析軟體得到unigene fasta檔案，命名為my_unigenes.fa，格式如下表所示：

>MSTRG.5.1 gene=MSTRG.5
TGATGTCATCGATCCGTGACGTTTAGTATTCAACCAATAGGAATCAAC 

  
 

    

    
    轉錄組學習
      ide   man   perf   nal   his   mtools   學習   ast   ini   參考：https://github.com/xuzhougeng/Learn-Bioinformatics/ 轉錄組入門（1）: 工作環境準備 miniconda2 在裏面安裝各種工具 conda 

  
 

    

    
    轉錄組入門(4)：了解參考基因組及基因註釋
      evel   pin   tps   下載安裝   剪切   坐標系   sem   2016年   ota   任務列表

1.在UCSC下載hg19參考基因組；
2.從gencode數據庫下載基因註釋文件，並且用IGV去查看感興趣的基因的結構，比如TP53，KRAS，EGFR等等。
3.截圖幾個基 

  
 

    

    
    轉錄組中  實驗設計  的相關問題
      改善   多少   重復   nbsp   做了   strong   深度   相關   fff   1.單端測序還是雙端測序
2.測序的讀長是多少
3.是否建立鏈特異性庫
4.需要多少的測序數據量（即測序深度是多少）
5.設置多少個生物學重復比較好      
 
6.如果我們做了生物學重復還要做技術重復 

  
 

    

    
    前言 轉錄組
      部分   陣列   推斷   void   相同   所有   start   組成   oid   
轉錄組
　　轉錄組（Transcriptome），廣義上指在相同環境（或生理條件）下的一個細胞、或一群細胞中所能轉錄出的所有RNA的總和，包括 信使RNA（mRNA）、核糖體RNA（rRNA）、轉運RN 

  
 

    

    
    aiway轉錄組pipline
      finish   .sh   nbsp   分享圖片   bubuko   san   load   info   配置   一） 安裝流程軟件
下載軟件，配置環境變量，這裏不做介紹
二)下載原始數據
2.1）建SRR_Acc_List.txt文件放置將要下載的SRR號(https://www.ncbi.nl 

  
 

    

    
    120分的轉錄組試題和答案
      120分的轉錄組試題和答案 
 
 這個答案之前出過三份，最近整理了一份文字版，方便觀看，還請大家多多補充。 
  
   
   120分的轉錄組試題（第一份答案） 
   120分的轉錄組試題（第二份答案） 
   120分的轉錄組試題（第三份答案） 
   
  
 一、理論題目 
 1、說出至少5種高 

  
 

    

    
    HISAT2,StringTie，Ballgown處理轉錄組資料
      HISAT2,StringTie，Ballgown處理轉錄組資料  
本文總閱讀量次2017-05-26 
 
 HISAT2,StringTie，Ballgown處理轉錄組資料思路如下： 
  
  資料質控 
  將RNA-seq的測序reads使用hisat2比對 
  samtools將sa 

  
 

    

    
    評估轉錄組從頭組裝準確度的新方法
       
 [轉載]評估轉錄組從頭組裝準確度的新方法 
 已有 2304 次閱讀 2014-12-30 11:47 |個人分類:轉錄組測序|系統分類:科研筆記|關鍵詞:轉錄組denovo測序,轉錄組denovo組裝,裝錄組denovo組裝結果評估新方法| 轉錄組denovo測序,&nb 

  
 

    

    
    巨集基因組理論教程6巨集轉錄組
       
 
  
  
 之前分享的加拿大生信網出品的《巨集基因組分析教程》，有1萬多位朋友閱讀，有近2000多小夥伴下載了課程PPT。 
 但不知有多少小夥伴真正仔細學習過。收藏是沒有用的，只有真正多學幾遍才有收穫。 
 對於英文原版教程，很多新人有看不懂，學不會的問題。巨集基因組團隊針對這套教程進了翻譯，同時 

  
 

    

    
    轉錄組拼接軟體Trinity使用安裝報錯錦集
       
 
  
  
 由於要做無參轉錄組分析，所以就要使用trinity來做reads的拼接。 但是自己安裝trinity時遇見了一堆問題，最終一一解決，解決方案分享在下面。 
 最開始我去github看Trinity的wiki，它給出直接編譯的方案來安裝trinity，但是很不幸，我使用cmake的時候，系

轉錄組分析流程

文章目錄

分析流程概述

下載測試資料

資料質量控制

Tophat –> Cufflink –> Cuffdiff

手動安裝相關軟體

流程程式碼

Subread -> featureCounts -> DESeq2

流程程式碼

轉錄組分析流程

轉錄組分析---Hisat2+StringTie+Ballgown使用

轉錄組分析綜述A survey of best practices for RNA-seq data analysis

易生信九天的轉錄組分析培訓班總結

轉錄組差異表達分析小實戰（一）

轉錄組差異表達分析小實戰（二）

微生物組學數據分析工具綜述 | 16S+宏基因組＋宏病毒組＋宏轉錄組--轉載

總結實驗室對轉錄組及lncRNA資料分析的思路

RNA_seq(1)植物轉錄組實戰（下）之DESeq2進行差異基因分析

無參轉錄組GO、KEGG富集分析——diamond+idmapping+GOstats

轉錄組學習

轉錄組入門(4)：了解參考基因組及基因註釋

轉錄組中實驗設計的相關問題

前言轉錄組

aiway轉錄組pipline

120分的轉錄組試題和答案

HISAT2,StringTie，Ballgown處理轉錄組資料

評估轉錄組從頭組裝準確度的新方法

巨集基因組理論教程6巨集轉錄組

轉錄組拼接軟體Trinity使用安裝報錯錦集