1. 程式人生 > >bam/sam 資料格式的介紹 (二)

bam/sam 資料格式的介紹 (二)

5.詳解

舉例:

E00606:11:H2CC3CCXY:8:1101:7172:1419577*0 0**00 CTACGAGTCATTTAGCACCGGGTTCTCCACAAACTTGCGGTGCGTCTCCAGAGAGGGGCGGCACTCGTTCGGCCGCACCCCGGTCCAGTCACGAACGGCTCTCCACACCGGCCGGCCCCGGGGGGTCGACCGGCTATCCCAGGCCAATCAAAFFFFFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFJJJJJJJJJJJJJJJJJFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJ<JFJJJJ<FJJJJJJJJJJJJJJJJJ)FJ<JJJJJJFJJJJJJJJJJFJJ<XM:i:0
E00606:11:H2CC3CCXY:8:1101:7172:14195 2:N:0:ATCACG 141*00* *00AGACATTTGGTGCGTGTGCTTGGCTGAGGAGCCACTGGTGCGAAGCTACCATCTGTGGGATTATGACTGAACGCCTCTAAGTCAGAATCCCGCCTAAACGTAACGATACCGCAGCGCCGCGGGACTTTGATTGGCCTGGGATAGCCGGTCAAAFFFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFJJJFJJJJ<JAJJJJJJJ<JJJJJ<JJJJJJJJJF7JJFFFJJJJJFJAJJJAJFJJJJ7JJFJJFFA-A7FFJJJJF-AFJJJJJJJJXM:i:0
E00606:11:H2CC3CCXY:8:1101:6400:1419577*0 0**00 GCGGGATGCAGGCCGCTCACCATGGCGACGGAGCTGGAGGCGTGGCTCATGTATGAGGATGTCTGGGGCAGCGGATACGTCACCACCTCCAGTACATCATGAGAGCTGCGCTTGAAGCGGTTATTACTGGGCAGCGGCAGCAGGGGGCAGAAFFFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJXM:i:0
E00606:11:H2CC3CCXY:8:1101:7963:14195 2:N:0:ATCACG 141*00* *00GAGTCTAACGCACGCGCGAGTCAAAGGGTGTCTCCGAGCCCCCACGGCGCAATGAAGGTGAAGGCCGGCGCTCGCCGGCCCAGGTGGGATCCCCCCGCCCCGGCGGGGGGCGCACCACCGGCCCGTCTCGCCCGCACCGCCGGGCAGGTGAAAFFJJJJJJJJJJJJJJJFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJAJJJJJJJFJFJJFJJJJJ<JJJJJJJ<FJJJFJJJFFFJJJJFJJJFJJJJJJJJJJJJJ)AFFJJJJFJJJFFJJJJJJJJ)7<JF--<FJFJ)<XM:i:0

1)QNAME

query name 一般就是read名稱 如:E00606:11:H2CC3CCXY:8:1101:7172:14195

2)FLAG  


以下資訊來自於:http://www.cnblogs.com/xudongliang/p/5437850.html

/*! @abstract the read is paired in sequencing, no matter whether it is mapped in a pair */
#define BAM_FPAIRED        1
/*! @abstract the read is mapped in a proper pair */
#define BAM_FPROPER_PAIR   2
/*! @abstract the read itself is unmapped; conflictive with BAM_FPROPER_PAIR */
#define BAM_FUNMAP         4
/*! @abstract the mate is unmapped */
#define BAM_FMUNMAP        8
/*! @abstract the read is mapped to the reverse strand */
#define BAM_FREVERSE      16
/*! @abstract the mate is mapped to the reverse strand */
#define BAM_FMREVERSE     32
/*! @abstract this is read1 */
#define BAM_FREAD1        64
/*! @abstract this is read2 */
#define BAM_FREAD2       128
/*! @abstract not primary alignment */
#define BAM_FSECONDARY   256
/*! @abstract QC failure */
#define BAM_FQCFAIL      512
/*! @abstract optical or PCR duplicate */
#define BAM_FDUP        1024
/*! @abstract supplementary alignment */
#define BAM_FSUPPLEMENTARY 2048

1 : 代表這個序列採用的是PE雙端測序

2: 代表這個序列和參考序列完全匹配,沒有錯配和插入缺失

4: 代表這個序列沒有mapping到參考序列上

8: 代表這個序列的另一端序列沒有比對到參考序列上,比如這條序列是R1,它對應的R2端序列沒有比對到參考序列上

16:代表這個序列比對到參考序列的負鏈上

32 :代表這個序列對應的另一端序列比對到參考序列的負鏈上

64 : 代表這個序列是R1端序列, read1;

128 : 代表這個序列是R2端序列,read2;

256: 代表這個序列不是主要的比對,一條序列可能比對到參考序列的多個位置,只有一個是首要的比對位置,其他都是次要的

512: 代表這個序列在QC時失敗了,被過濾不掉了(# 這個標籤不常用)

1024: 代表這個序列是PCR重複序列(#這個標籤不常用)

2048: 代表這個序列是補充的比對(#這個標籤具體什麼意思,沒搞清楚,但是不常用)

上面的這幾個標籤都是2的n次方,這樣的數列有一個特點,就是隨機挑選其中的幾個,它們的和是唯一的,比如65 只能是1 和 64 組成,代表這個序列是雙端測序,而且是read1

samtools 中flag 可以檢視flags詳細資訊:如:

$samtools flags 77
0x4d    77      PAIRED,UNMAP,MUNMAP,READ1
flags值為77 
PAIRED表示這條序列採用雙端測序, 其值為1;
UNMAP表示這個序列沒有mapping到參考序列上, 其值為4;
MUNMAP表示這個序列的另一端序列沒有比對到參考序列上, 其值為8;
READ1表示這條序列是R1端序列,其值為64.
以上數值相加和為77

$samtools flags 141
0x8d    141     PAIRED,UNMAP,MUNMAP,READ2
flags值為141
PAIRED表示這條序列採用雙端測序, 其值為1;
UNMAP表示這個序列沒有mapping到參考序列上, 其值為4;
MUNMAP表示這個序列的另一端序列沒有比對到參考序列上, 其值為8;
READ1表示這條序列是R1端序列,其值為128.
以上數值相加和為141

3)RNAME

reference sequence name

一般是參考基因組染色體名稱,如果沒有比對上,用*表示

相關推薦

bam/sam 資料格式介紹

5.詳解 舉例: E00606:11:H2CC3CCXY:8:1101:7172:1419577*0 0**00 CTACGAGTCATTTAGCACCGGGTTCTCCACAAACTTGCGGTGCGTCTCCAGAGAGGGGCGGCACTCGTTCGGCCGCACCC

Python3常用資料結構及方法介紹——元組

二.元組 tuple 1特點: ①元組不可更改 ②圓括號 ③可重新賦值 >>> tuple0=(1,2,3) >>> tuple0=(2,3,4,1) >>> tuple0 (2, 3, 4, 1) 2常用元組操作(與列表類

資料分析需要的工具介紹

我們在上一篇文章中給大家介紹了資料分析軟體中的Excel和SAS軟體,但是這些軟體還是不夠的,我們還需要學習很多的工具,在這篇文章中我們會為大家介紹一下資料分析工具中的其他工具。希望這篇文章能夠給大家帶來幫助。 首先我們給大家說一下R軟體,R是一套完整的資料處理、計算和製圖軟體系統。r語言的主要優點有資

TensorFlow實戰——交通標誌牌GTSRB資料格式轉換

 前言:      在上一篇部落格學習瞭如何將資料集轉換成jpg檔案,本文介紹如何將資料集轉換為png的格式,以及如何將資料資訊儲存在csv檔案中,實現程式碼比上編部落格有所改進。一、格式轉換     我的訓練資料集儲存路徑如下:隨意進入一個資料夾,可以看到:    來看看測

DNS服務器介紹——主從復制和區域轉發

dns;區域轉發;主從復值背景介紹實際環境中為了避免單點故障,DNS服務器是由一組服務器組成每一個服務器上都有若幹個區域,不同服務器上的相同區域分為主和從兩種角色。由於正向和反向是不同的區域,所以多臺服務器間的相同區域可以互為主從或者一主多從,本處以右圖為例進行演示。DNS服務器的主從復制1.之前已經在172

集成CCFlow工作流與GPM的辦公系統馳騁CCOA介紹

崗位 mes 顯示 ccf 辦公 人員 文件 ron min GPM怎樣控制菜單權限以及菜單的增刪顯示 因為CCOA中僅僅有屬於admin才幹夠進行權限管理與流程設計。password為pub。 1.加入CCOA功能菜單 進入GPM後,找到編號為CCOA的信

Struts2入門介紹

輸入 clu ons dom 訪問路徑 訪問 filter pri locale 一、Struts執行過程的分析。   當我們在瀏覽器中輸入了網址http://127.0.0.1:8080/Struts2_01/hello.action的時候,Struts2做了如下過程:

深度學習數學基礎介紹概率與數理統計

特征 數字特征 抽樣分布 第5章 最大 中心 3.4 獨立 知識 第1章 隨機事件與概率§1.1 隨機事件§1.2 隨機事件的概率§1.3 古典概型與幾何概型§1.4 條件概率§1.5 事件的獨立性 第2章 隨機變量的分布與數字特征§2.1 隨機變量及其分布§2.2 隨機變

上門洗車APP --- Androidclient開發 之 網絡框架封裝介紹

glob imp success rgb sed error margin p s 再次 上門洗車APP --- Androidclient開發 之 網絡框架封裝介紹(二)前幾篇博文中給大家介紹了一下APP中的基本業務及開發本項目使用的網絡架構:上門洗車APP ---

Spring MVC 框架結構介紹

指定 let url 16px () isp -s 一個 ping Spring MVC框架結構    Spring MVC是圍繞DispatcherServlet設計的,DispatcherServlet向處理程序分發各種請求。處理程序[email prot

Wireshark使用介紹:應用Wireshark觀察基本網絡協議

使用 額外 傳輸過程 直接 nal http協議 ges log 傳輸 TCP: TCP/IP通過三次握手建立一個連接。這一過程中的三種報文是:SYN,SYN/ACK,ACK。 第一步是找到PC發送到網絡服務器的第一個SYN報文,這標識了TCP三次握手的開始。

javascript 對象簡單介紹

則表達式 數字 orange red 1.4 dom 空白字符 手冊 document JavaScript Array(數組) 對象數組對象的作用是:使用單獨的變量名來存儲一系列的值。 什麽是數組?數組對象是使用單獨的變量名來存儲一系列的值。如果你有一組數據(例如:車名字

[數據分析工具] Pandas 功能介紹

技術 describe 索引 sum cat std 簡單 方法 nbsp 條件過濾 我們需要看第一季度的數據是怎樣的,就需要使用條件過濾 體感的舒適適濕度是40-70,我們試著過濾出體感舒適濕度的數據 最後整合上面兩種條件,在一季度體感濕度比較舒適的數據

23種設計模式介紹---- 結構型模式

implement weight 代碼 介紹 定義 裝飾器模式 大量 技術分享 記憶 由於設計模式篇幅比較大,如果在一篇文章講完所有的設計模式的話不利於閱讀。於是我把它分為三篇文章 23種設計模式介紹(一)---- 創建型模式 23種設計模式介紹(二)---- 結構

MongoDB復制集的工作原理介紹

不能 數據同步 nat ring $inc tla 2.3 支持 pla 復制集工作原理 1)數據復制原理 開啟復制集後,主節點會在 local 庫下生成一個集合叫 oplog.rs,這是一個有限集合,也就是大小是固定的。其中記錄的是整個mongod實例一段時間內數據庫

自動化運維工具ansible Playbook介紹

nec 註意 ddr 連接 文件中 可用 ges use sta 一.playbook介紹playbook是由一個或多個"play"組成的列表。play的主要功能在於將事先歸並為一組的主機裝扮成事先通過ansible中的task定義好的角色。從根本上來講

Python影象處理庫PIL中影象格式轉換

參考:https://blog.csdn.net/icamera0/article/details/50843196?utm_source=blogxgwz0 接上一篇《Python影象處理庫PIL中影象格式轉換(一)》 二、其他不同模式轉換為“RGB”模式 模式“RGB”為24位彩色影

微服務架構下的資料一致性保證:可靠事件模式

第一篇分享中講到實現可靠事件模式的關鍵在於:可靠事件投遞和避免事件重複消費,其中避免事件重複消費需要微服務滿足冪等性。那麼又該如何實現可靠事件投遞?又該如何保證服務滿足冪等性? 轉載本文需註明出處:EAII企業架構創新研究院,違者必究。如需加入微信群參與微課堂、架構設計與討論直播請

PHP規範PSR7HTTP訊息介面介紹

1.3 流 HTTP訊息由起始行,標題和正文組成。 HTTP訊息的主體可能非常小或非常大。嘗試將訊息正文表示為字串很容易消耗比預期更多的記憶體,因為正文必須完全儲存在記憶體中。嘗試將請求或響應的主體儲存在記憶體中將阻止使用該實現能夠使用大型訊息體。 StreamInterface用於在讀取或寫入

PHP規範PSR2編碼指南介紹

4.4 方法引數 在引數列表中,每個逗號前不得有空格,每個逗號後必須有一個空格。 具有預設值的方法引數必須位於引數列表的末尾。 <?php namespace Vendor\Package; class ClassName { public function foo($a