轉錄本組裝軟體StringTie的使用說明
轉錄本組裝軟體StringTie的使用說明
轉錄本組裝軟體StringTie的使用說明轉錄組分析流程 HISTA + StringTie 組合。其Protocol 發表在Nature Protocol 上“Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown”
其中StringTie 在組裝轉錄本的完整度,精度和速度方面都較以往的cufflinks 有很大的提升。
StringTie 使用說明:
stringtie <input.bam ..> [-G <guide_gff>] [-l <label>] [-o <out_gtf>] [-p <cpus>]
[-v] [-a <min_anchor_len>] [-m <min_tlen>] [-j <min_anchor_cov>] [-f <min_iso>]
[-C <coverage_file_name>] [-c <min_bundle_cov>] [-g <bdist>] [-u]
[-e] [-x <seqid,..>] [-A <gene_abund.out>] [-h] {-B | -b <dir_path>}
選項:
--version : 輸出軟體的版本資訊
-G 參考序列的基因註釋檔案 (GTF/GFF3)
-l 輸出轉錄本的名稱字首 (default: STRG)
-f 最少轉錄本的比例 (default: 0.1)
-m 組裝轉錄本的最小長度 (default: 200)
-o 組裝轉錄本的GTF註釋檔案 (default: stdout)
-a 連線位點錨定序列的最小長度 (default: 10)
-j 連線位點的最小覆蓋度 (default: 1)
-t 基於覆蓋度對預測的轉錄本進行修正 (default: coverage trimming is enabled)
-c 組裝轉錄本的reads最小覆蓋度(default: 2.5)
-v 輸出log 資訊
-g 比對上的reads 間距大於閥值則新城一個新的轉錄束 (default: 50)
-C 輸出參考轉錄本中被reads 覆蓋到的轉錄本
-M 轉錄束允許多比對reads覆蓋的最大佔比 (default:0.95)
-p 執行緒(CPU)數 (default: 1)
-A 基因豐都輸出檔案
-B 在輸出的GFT同目錄下輸出Ballgown table 檔案
-b 在 <dir_path> 目錄下輸出Ballgown table 檔案
-e 只對參考轉錄本進行豐都評估 (requires -G)
-x 不在參考序列區域組裝任何的新轉錄本
-u 多比對校正 (default: correction enabled)
-h 輸出軟體的幫助資訊
轉錄本合併模式使用說明:
stringtie --merge [Options] { gtf_list | strg1.gtf ...}
選項
-G <guide_gff> 參考轉錄本的註釋資訊 (GTF/GFF3)
-o <out_gtf> 合併轉錄本的GTF輸出檔案 (default: stdout)
-m <min_len> 合併轉錄本的最小長度(default: 50)
-c <min_cov> 合併轉錄本的最低覆蓋度(default: 0)
-F <min_fpkm> 合併轉錄本的最小FPKM值(default: 1.0)
-T <min_tpm> 合併轉錄本的最小TPM值(default: 1.0)
-f <min_iso> isoform 最小比例(default: 0.01)
-g <gap_len> 轉錄本見GAP長度小於閥值則合併兩轉錄本 (default: 250)
-i 允許合併轉錄本中有內含子保留; by default
-l <label> 輸出的轉錄本名稱字首 (default: MSTRG)
如果您對轉錄組資料分析感興趣的話,可以學習我的課程:《 有參轉錄組資料分析》