1. 程式人生 > 其它 >2021.01.18丨sRNAnalyzer分析流程

2021.01.18丨sRNAnalyzer分析流程

技術標籤:生物資訊RNA-seq

  • 最近接到一個miRNA的分析專案,經過網上初步的一個工具搜尋,選擇了本地分析工具sRNAnalyzer進行比對和統計miRNA分類,使用線上分析工具miRWalk預測了miRNA的Target Gene。本篇文章是對sRNAnalyzer工具使用的一個梳理,對使用過程中遇到的一些問題進行註釋。
  • 軟體說明文件連結:http://srnanalyzer.systemsbiology.net/start.html
  • 在安裝sRNAnalyzer之前,我們需要預安裝三款軟體,這些使用conda/miniconda都可以自動安裝
    • fastx_toolkit、cutadapt、bowtie #不是bowtie2
    • conda install fastx_toolkit cutadapt bowtie #遇到報錯可以一個一個進行安裝

  • sRNAnalyzer安裝環境
    • Make sure you have python 2.6 or later and perl 5 or later installed
    • python2.6及以上版本;perl5及以上版本
  • sRNAnalyzer以及參考基因組下載地址
    • *Human and Exogenous Databases MainDBs
  • step.0 使用前設定
    • ,建立名為pipeline_config.conf,開啟編輯,複製sRNAnalyzer路徑下的pipeline_config.yaml檔案
    • vi pipeline_config.conf

    • 擷取部分內容,preprocess對預處理過程中的引數進行設定
      • stop-oligo: false,設定是否有結束序列
      • min-length: 最短序列長度
      • kit: Illumina ,設定建庫試劑盒,據此來設定不同的接頭序列,還有兩個引數為、NEB、4N
      • gzip: true,設定fastq是否為壓縮格式
    • alignment
      • type: single,設定資料是單端還是雙端
      • human_miRNA: 2 #設定比對時最大的錯配鹼基數,下同
  • step.1 去接頭及質控
    • 執行指令碼
      • preprocess.pl --config pipeline_config.conf

  • step.2 比對及定量
    • 編輯../DB/sRNA_DBs路徑下的DB_config.conf檔案,修改base一行,表示sRNA_DBs檔案所在的絕對路徑,下面其他資料庫則在base路徑的子目錄
    • 執行指令碼
      • align.pl 01.data pipeline_config.conf DB_config.conf #如果DB_config.conf在其他位置記得新增路徑

      • 01.data:資料預處理的資料夾
      • pipeline_config.conf:資料預處理時的流程配置檔案
      • DB_config.conf:資料庫配置檔案
    • 結果檔案
      • XX_Processed.profile #記錄了每一條read比對結果
      • XX_Cutadapt.reportGSM3593663_Processed.dist #reads長度分佈檔案
      • XX_Processed.feature #定量結果
      • XX_Processed_unMatch.fa #沒有比對上參考基因組的reads
  • step.3 獲取統計檔案
    • 使用工具中提供的統計指令碼,可以將各個樣品的結果統計彙總
    • 執行指令碼
      • summarize.pl DB_config.conf --project smallrna

      • summarize.pl還有兩個可選引數,--miRNA和--exogenous,具體作用可以參考說明文件
    • 結果展示
      • smallrna_distCount.sum #reads length統計
      • smallrna.distRate.sum #reads length統計佔比
      • smallrna.profile #比對結果
      • smallrna.feature #定量結果
      • smallrna_matchCount.sum #匹配reads數
      • smallrna_matchRate.sum #匹配率
      • smallrna_stp.sum #不清楚
      • smallrna_des.profile #不清楚
      • smallrna_des.feature #不清楚
      • smallrna_trimRate.sum #去介面過濾結果
  • 至此,sRNAnalyzer對miRNA的分析已經結束,後期的功能註釋我會另起一篇文章,對miRWalk進行描述。歡迎探討交流。
  • 參考文章:https://www.jianshu.com/p/bace4e385d76