2021.01.18丨sRNAnalyzer分析流程
阿新 • • 發佈:2021-02-06
- 最近接到一個miRNA的分析專案,經過網上初步的一個工具搜尋,選擇了本地分析工具sRNAnalyzer進行比對和統計miRNA分類,使用線上分析工具miRWalk預測了miRNA的Target Gene。本篇文章是對sRNAnalyzer工具使用的一個梳理,對使用過程中遇到的一些問題進行註釋。
- 軟體說明文件連結:http://srnanalyzer.systemsbiology.net/start.html
- 在安裝sRNAnalyzer之前,我們需要預安裝三款軟體,這些使用conda/miniconda都可以自動安裝
- fastx_toolkit、cutadapt、bowtie #不是bowtie2
-
conda install fastx_toolkit cutadapt bowtie #遇到報錯可以一個一個進行安裝
- sRNAnalyzer安裝環境
- Make sure you have python 2.6 or later and perl 5 or later installed
- python2.6及以上版本;perl5及以上版本
- sRNAnalyzer以及參考基因組下載地址
- sRNAnalyzer Pipeline sRNAnalyzer #必下
- small RNA Databases sRNA_DBs #必下
- *Human and Exogenous Databases MainDBs
- *NCBI Non-Human Databases NCBI_NonHuman
- *E.Coli Samples for Pipeline Evaluation E_coli_evaluation_samples
- step.0 使用前設定
- ,建立名為pipeline_config.conf,開啟編輯,複製sRNAnalyzer路徑下的pipeline_config.yaml檔案
-
vi pipeline_config.conf
- 擷取部分內容,preprocess對預處理過程中的引數進行設定
- stop-oligo: false,設定是否有結束序列
- min-length: 最短序列長度
- kit: Illumina ,設定建庫試劑盒,據此來設定不同的接頭序列,還有兩個引數為、NEB、4N
- gzip: true,設定fastq是否為壓縮格式
- alignment
- type: single,設定資料是單端還是雙端
- human_miRNA: 2 #設定比對時最大的錯配鹼基數,下同
- step.1 去接頭及質控
- 執行指令碼
-
preprocess.pl --config pipeline_config.conf
-
- 結果
- XX_Cutadapt_Prinseq.report #過濾統計
- XX_Cutadapt.report #去介面統計
- XX_Processed.fa #過濾後的序列檔案
- 可能報錯及解決辦法:
- 解決方法:進入preprocess.pl 指令碼,找到use Digest::MD5 qw(md5_hex),直接註釋掉,其他嘗試解決的方法,參考連結:https://share.mubu.com/doc/6leAXdknOku
- 執行指令碼
- step.2 比對及定量
- 編輯../DB/sRNA_DBs路徑下的DB_config.conf檔案,修改base一行,表示sRNA_DBs檔案所在的絕對路徑,下面其他資料庫則在base路徑的子目錄
- 執行指令碼
-
align.pl 01.data pipeline_config.conf DB_config.conf #如果DB_config.conf在其他位置記得新增路徑
- 01.data:資料預處理的資料夾
- pipeline_config.conf:資料預處理時的流程配置檔案
- DB_config.conf:資料庫配置檔案
-
- 結果檔案
- XX_Processed.profile #記錄了每一條read比對結果
- XX_Cutadapt.reportGSM3593663_Processed.dist #reads長度分佈檔案
- XX_Processed.feature #定量結果
- XX_Processed_unMatch.fa #沒有比對上參考基因組的reads
- step.3 獲取統計檔案
- 使用工具中提供的統計指令碼,可以將各個樣品的結果統計彙總
- 執行指令碼
-
summarize.pl DB_config.conf --project smallrna
- summarize.pl還有兩個可選引數,--miRNA和--exogenous,具體作用可以參考說明文件
-
- 結果展示
- smallrna_distCount.sum #reads length統計
- smallrna.distRate.sum #reads length統計佔比
- smallrna.profile #比對結果
- smallrna.feature #定量結果
- smallrna_matchCount.sum #匹配reads數
- smallrna_matchRate.sum #匹配率
- smallrna_stp.sum #不清楚
- smallrna_des.profile #不清楚
- smallrna_des.feature #不清楚
- smallrna_trimRate.sum #去介面過濾結果
- 至此,sRNAnalyzer對miRNA的分析已經結束,後期的功能註釋我會另起一篇文章,對miRWalk進行描述。歡迎探討交流。
- 參考文章:https://www.jianshu.com/p/bace4e385d76