1. 程式人生 > >macs2的輸出檔案解讀

macs2的輸出檔案解讀

轉載自:https://www.jianshu.com/p/21e8c51fca23

NAME_peaks.xls
包含peak資訊的tab分割的檔案,前幾行會顯示callpeak時的命令。輸出資訊包含:

  • 染色體號
  • peak起始位點
  • peak結束位點
  • peak區域長度
  • peak的峰值位點(summit position)
  • peak 峰值的高度(pileup height at peak summit, -log10(pvalue) for the peak summit)
  • peak的富集倍數(相對於random Poisson distribution with local lambda

 

NAME_peaks.narrowPeak
*narrowPeak檔案是BED6+4格式,可以上傳到UCSC瀏覽。輸出檔案每列資訊分別包含:

  • 1;染色體號
  • 2:peak起始位點
  • 3:結束位點
  • 4:peak name
  • 5:int(-10*log10qvalue)
  • 6 :正負鏈
  • 7:fold change
  • 8:-log10pvalue
  • 9:-log10qvalue
  • 10:relative summit position to peak start(?)

  • NAME_summits.bed
    BED格式的檔案,包含peak的summits位置,第5列是-log10pvalue。如果想找motif,推薦使用此檔案。

Remove the beginning track line if you want to analyze it by other tools.???

  • .bdg
    bedGraph格式,可以匯入UCSC或者轉換為bigwig格式。兩種bfg檔案:treat_pileup, and control_lambda.
  • NAME_peaks.broadPeak
    BED6+3格式與narrowPeak類似,只是沒有第10列。

summits.bed,narrowPeak,bdg, xls四種類型輸出檔案的比較:

  • xls檔案
    檔案包含資訊還是比較多的,和narrowPeak唯一不同的是peak的起始位置需要減1才是bed格式的檔案,另外還包含fold_enrichment 和narrowPeak的fold change 對應,-log10pvalue,-log10qvalue,peak長度,peak 峰值位置等。
  • narrowPeak檔案
    和xls檔案資訊類似
  • summits.bed檔案
    包含峰的位置資訊和-log10pvalue
  • bdg檔案
    bdg檔案適合匯入UCSC或IGV進行譜圖視覺化,或者轉換為bigwig格式再進行視覺化。
    為什麼染色體號後面會出現其他的字串????



 

作者:六六_ryx
連結:https://www.jianshu.com/p/21e8c51fca23
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯絡作者獲得授權並註明出處。