1. 程式人生 > >Fastq與Fasta格式

Fastq與Fasta格式

一、關於Fastq

FASTQ是基於文字的,儲存生物序列(通常是核酸序列)和其測序質量資訊的標準格式。其序列以及質量資訊都是使用一個ASCII字元標示,最初由Sanger開發,目的是將FASTA序列與質量資料放到一起,目前已經成為高通量測序結果的事實標準。

二、Fastq的格式

FASTQ檔案中每個序列通常有四行:第一行,序列標識以及相關的描述資訊,以‘@’開頭;第二行是序列;第三行以‘+’開頭,後面是序列標示符、描述資訊,或者什麼也不加;第四行,是質量資訊,和第二行的序列相對應,每一個序列都有一個質量評分,根據評分體系的不同,每個字元的含義表示的數字也不相同。

例如

@SEQ_ID
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65


 三、關於Fasta

Fasta格式也稱為Pearson格式,是一種基於文字用於表示核苷酸序列或氨基酸序列的格式。在這種格式中鹼基對或氨基酸用單個字母來編碼,且允許在序列前新增序列名及註釋。

四、Fasta格式

Fasta格式首先以大於號“>”開頭,接著是序列的識別符號;換行後是序列的描述資訊。換行後是序列資訊,檔案每行的字母一般不應超過80個字元。序列中允許存在空格,換行,空行,直到下一個大於號或檔案結束,表示該序列的結束。

>gi|46575915|ref|NM_008261.2| Mus musculus hepatic nuclear factor 4, alpha (Hnf4a), mRNA
GGGACCTGGGAGGAGGCAGGAGGAGGGCGGGGACGGGGGGGGCTGGGGCTCAGCCCAGGGGCTTGGGTGG
CATCCTGGGCCGGGCAGGACAGGGGGCTAAGGCGTGGGTAGGGGAGAATGCGACTCTCTAAAACCCTTGC
CGGCATGGATATGGCCGACTACAGCGCTGCCCTGGACCCAGCCTACACCACCCTGGAGTTTGAAAATGTG
CAGGTGTTGACCATGGGCAATGACACGTCCCCATCTGAAGGTGCCAACCTCAATTCATCCAACAGCCTGG
GCGTCAGTGCCCTGTGCGCCATCTGTGGCGACCGGGCCACCGGCAAACACTACGGAGCCTCGAGCTGTGA
CGGCTGCAAGGGGTTCTTCAGGAGGAGCGTGAGGAAGAACCACATGT

相關推薦

【生信】FastqFasta格式

Fastq與Fasta格式 一、關於Fastq FASTQ是基於文字的,儲存生物序列(通常是核酸序列)和其測序質量資訊的標準格式。其序列以及質量資訊都是使用一個ASCII字元標示,最初由Sanger開發,目的是將FASTA序列與質量資料放到一起,目前已經成為高通量測序結果的事實標準。

FastqFasta格式

一、關於Fastq FASTQ是基於文字的,儲存生物序列(通常是核酸序列)和其測序質量資訊的標準格式。其序列以及質量資訊都是使用一個ASCII字元標示,最初由Sanger開發,目的是將FASTA序列與質量資料放到一起,目前已經成為高通量測序結果的事實標準。 二、Fastq的

springCloud--補充:返回jsonxml格式

spring cloud 返回json與xml格式 [email protected]/* */,現在還沒有找到原因,使用如下可以如常的返回json格式:@RestController public class UserController { @Autowired pri

10.2-10.3 datetime時間格式的相互轉換

datetime time stampSubclass relationships: 這類直接的對應關系# object # timedate # tzinfo # time #基本不使用 # date # datetime #一般使用 datetime 取時間 import time f

python | 輸入輸出 | 格式

pytho txt content 小數 python3 con eva pan 文件中 1 # encoding: utf-8 2 3 # python3中的input相當於python2中的raw_input(未加工) 4 content = input(‘

APDU命令響應格式【轉】

ref index bsp 數據 du命令 dex menu 轉載 也有 本文轉載自:http://map.im/apduintroduce 命令格式 APDU命令由命令頭和命令體組成: CLA | INS | P1 | P2 | Lc | DATA | Le命令頭:

WCF標準綁定以及傳輸協議編碼格式

blog image post 技術分享 info clas 分享圖片 gpo http WCF標準綁定以及傳輸協議與編碼格式

js時間戳日期格式的相互轉換

value hour ole div 得到 AR var minutes mes 下面總結一下js中時間戳與日期格式的相互轉換: 1. 將時間戳轉換成日期格式: function timestampToTime(timestamp) { var date

js時間戳日期格式之間相互轉換

時間日期 TP var gets nbsp unix時間 其他 value nds 時間戳:是一種時間表示方式,定義為從格林威治時間1970年01月01日00時00分00秒起至現在的總秒數。Unix時間戳不僅被使用在Unix系統、類Unix系統中,也在許多其他操作系統中被

Java時間戳日期格式字符串的互轉

equals try catch 日期格式 cond @param 字符 equal return 上代碼: import java.text.SimpleDateFormat; import java.util.Date; public class DateUtil

前端頁面播放 rtmp 流 flv 格式視頻文件

media ready nbsp 元素 gif .class create ckplayer -s 技術 :angular/cli , html5 , typescript , scss ,es 6 ... 項目類型:直播視頻與視頻回放 使用到 插件 : videojs +

golang結構體json格式

package main import ( "encoding/json" "fmt" ) type IT struct { //一定要注意這裡的成員變數的名字首字母必須是大寫 Company string Subjects []string Isok bool Price

Intel格式Motorola格式的區別

文章出處:http://blog.csdn.net/ppdyhappy/article/details/52700464 Intel低位元組在前 Motorola高位元組在前    在進行CAN匯流排通訊設計或者測試過程中,經常看到

JS實現隨機顏色的3種方法顏色格式的轉化

JS實現隨機顏色的3種方法與顏色格式的轉化   隨機顏色和顏色格式是我們在開發中經常要用到的一個小功能,網上相關的資料也很多,想著有必要總結一下自己的經驗。所以這篇文章主要介紹了JS實現隨機顏色的3種方法與顏色格式的轉化,需要的朋友可以參考借鑑,下面來一

影象RGB2YUVYUV2RGB格式互轉介紹

1 YUV格式與RGB格式說明   由於不同國家的電視訊號系統支援的影象格式不同,有YUV格式成像,也有RGB格式成像,因此為了保證相容性,需要進行RGB與YUV格式的互轉。 另外YUV格式具有亮度資訊和色彩資訊分離的特點,但大多數影象處理操作都是基於RGB格式,需要將RGB格式轉

資料基礎---《利用Python進行資料分析·第2版》第6章 資料載入、儲存檔案格式

之前自己對於numpy和pandas是要用的時候東學一點西一點,直到看到《利用Python進行資料分析·第2版》,覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。 訪問資料是使用本書所介紹的這些工具的第一步。我會著重介紹pandas的資料輸入與輸出,雖然別的庫中也有不少以此為目的的工具

js moment時間戳時間格式相互轉換

var moment = require('moment') 獲取時間戳 : var res = moment(Date.now(), 'YYYY-MM-DD HH:mm:ss').valueOf(); 獲取格式時間: var res = moment(Date.n

MySQL時間戳日期格式的相互轉換

MySQL時間戳與日期格式的相互轉換,PHP時間戳與日期格式的相互轉換 MySQL: 獲取當前時間 SELECT NOW(); // 2018/10/11 14:22:51 時間日期格式轉換成時間戳格式,UNIX_TIMESTAMP()

合併並轉化一代測序seq純文字為fasta格式檔案

use strict; use warnings; my @dir; my @filelist; open OUT, ">result.fst"; opendir (DIR, "./") or die "can't open the directory!"; @dir = read

reads count檔案轉化為fasta格式檔案(redundant reads)

從NCBI下載的測序資料很多是去過接頭的,並且整理成readscount格式,即每行第一列為reads,第二列為reads數,而我們需要把它整理成fasta格式,並且每個read都整理為一條序列 原始檔案: cat GSM3124755_WTB_PARE.csv | h