macs2的輸出檔案解讀
阿新 • • 發佈:2018-11-08
轉載自:https://www.jianshu.com/p/21e8c51fca23
NAME_peaks.xls
包含peak資訊的tab分割的檔案,前幾行會顯示callpeak時的命令。輸出資訊包含:
- 染色體號
- peak起始位點
- peak結束位點
- peak區域長度
- peak的峰值位點(summit position)
- peak 峰值的高度(pileup height at peak summit, -log10(pvalue) for the peak summit)
- peak的富集倍數(相對於random Poisson distribution with local lambda
NAME_peaks.narrowPeak
*narrowPeak檔案是BED6+4格式,可以上傳到UCSC瀏覽。輸出檔案每列資訊分別包含:
- 1;染色體號
- 2:peak起始位點
- 3:結束位點
- 4:peak name
- 5:int(-10*log10qvalue)
- 6 :正負鏈
- 7:fold change
- 8:-log10pvalue
- 9:-log10qvalue
-
10:relative summit position to peak start(?)
- NAME_summits.bed
BED格式的檔案,包含peak的summits位置,第5列是-log10pvalue。如果想找motif,推薦使用此檔案。
Remove the beginning track line if you want to analyze it by other tools.???
- .bdg
bedGraph格式,可以匯入UCSC或者轉換為bigwig格式。兩種bfg檔案:treat_pileup, and control_lambda. - NAME_peaks.broadPeak
BED6+3格式與narrowPeak類似,只是沒有第10列。
summits.bed,narrowPeak,bdg, xls四種類型輸出檔案的比較:
- xls檔案
檔案包含資訊還是比較多的,和narrowPeak唯一不同的是peak的起始位置需要減1才是bed格式的檔案,另外還包含fold_enrichment 和narrowPeak的fold change 對應,-log10pvalue,-log10qvalue,peak長度,peak 峰值位置等。 - narrowPeak檔案
和xls檔案資訊類似 - summits.bed檔案
包含峰的位置資訊和-log10pvalue - bdg檔案
bdg檔案適合匯入UCSC或IGV進行譜圖視覺化,或者轉換為bigwig格式再進行視覺化。
為什麼染色體號後面會出現其他的字串????
作者:六六_ryx
連結:https://www.jianshu.com/p/21e8c51fca23
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯絡作者獲得授權並註明出處。