Fastq與Fasta格式
FASTQ是基於文字的,儲存生物序列(通常是核酸序列)和其測序質量資訊的標準格式。其序列以及質量資訊都是使用一個ASCII字元標示,最初由Sanger開發,目的是將FASTA序列與質量資料放到一起,目前已經成為高通量測序結果的事實標準。
二、Fastq的格式
FASTQ檔案中每個序列通常有四行:第一行,序列標識以及相關的描述資訊,以‘@’開頭;第二行是序列;第三行以‘+’開頭,後面是序列標示符、描述資訊,或者什麼也不加;第四行,是質量資訊,和第二行的序列相對應,每一個序列都有一個質量評分,根據評分體系的不同,每個字元的含義表示的數字也不相同。
例如
@SEQ_ID GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT + !''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
三、關於Fasta
Fasta格式也稱為Pearson格式,是一種基於文字用於表示核苷酸序列或氨基酸序列的格式。在這種格式中鹼基對或氨基酸用單個字母來編碼,且允許在序列前新增序列名及註釋。
四、Fasta格式
Fasta格式首先以大於號“>”開頭,接著是序列的識別符號;換行後是序列的描述資訊。換行後是序列資訊,檔案每行的字母一般不應超過80個字元。序列中允許存在空格,換行,空行,直到下一個大於號或檔案結束,表示該序列的結束。
>gi|46575915|ref|NM_008261.2| Mus musculus hepatic nuclear factor 4, alpha (Hnf4a), mRNA GGGACCTGGGAGGAGGCAGGAGGAGGGCGGGGACGGGGGGGGCTGGGGCTCAGCCCAGGGGCTTGGGTGG CATCCTGGGCCGGGCAGGACAGGGGGCTAAGGCGTGGGTAGGGGAGAATGCGACTCTCTAAAACCCTTGC CGGCATGGATATGGCCGACTACAGCGCTGCCCTGGACCCAGCCTACACCACCCTGGAGTTTGAAAATGTG CAGGTGTTGACCATGGGCAATGACACGTCCCCATCTGAAGGTGCCAACCTCAATTCATCCAACAGCCTGG GCGTCAGTGCCCTGTGCGCCATCTGTGGCGACCGGGCCACCGGCAAACACTACGGAGCCTCGAGCTGTGA CGGCTGCAAGGGGTTCTTCAGGAGGAGCGTGAGGAAGAACCACATGT
相關推薦
【生信】Fastq與Fasta格式
Fastq與Fasta格式 一、關於Fastq FASTQ是基於文字的,儲存生物序列(通常是核酸序列)和其測序質量資訊的標準格式。其序列以及質量資訊都是使用一個ASCII字元標示,最初由Sanger開發,目的是將FASTA序列與質量資料放到一起,目前已經成為高通量測序結果的事實標準。
Fastq與Fasta格式
一、關於Fastq FASTQ是基於文字的,儲存生物序列(通常是核酸序列)和其測序質量資訊的標準格式。其序列以及質量資訊都是使用一個ASCII字元標示,最初由Sanger開發,目的是將FASTA序列與質量資料放到一起,目前已經成為高通量測序結果的事實標準。 二、Fastq的
springCloud--補充:返回json與xml格式
spring cloud 返回json與xml格式 [email protected]/* */,現在還沒有找到原因,使用如下可以如常的返回json格式:@RestController public class UserController { @Autowired pri
10.2-10.3 datetime與時間格式的相互轉換
datetime time stampSubclass relationships: 這類直接的對應關系# object # timedate # tzinfo # time #基本不使用 # date # datetime #一般使用 datetime 取時間 import time f
python | 輸入與輸出 | 格式符
pytho txt content 小數 python3 con eva pan 文件中 1 # encoding: utf-8 2 3 # python3中的input相當於python2中的raw_input(未加工) 4 content = input(‘
APDU命令與響應格式【轉】
ref index bsp 數據 du命令 dex menu 轉載 也有 本文轉載自:http://map.im/apduintroduce 命令格式 APDU命令由命令頭和命令體組成: CLA | INS | P1 | P2 | Lc | DATA | Le命令頭:
WCF標準綁定以及傳輸協議與編碼格式
blog image post 技術分享 info clas 分享圖片 gpo http WCF標準綁定以及傳輸協議與編碼格式
js時間戳與日期格式的相互轉換
value hour ole div 得到 AR var minutes mes 下面總結一下js中時間戳與日期格式的相互轉換: 1. 將時間戳轉換成日期格式: function timestampToTime(timestamp) { var date
js時間戳與日期格式之間相互轉換
時間日期 TP var gets nbsp unix時間 其他 value nds 時間戳:是一種時間表示方式,定義為從格林威治時間1970年01月01日00時00分00秒起至現在的總秒數。Unix時間戳不僅被使用在Unix系統、類Unix系統中,也在許多其他操作系統中被
Java時間戳與日期格式字符串的互轉
equals try catch 日期格式 cond @param 字符 equal return 上代碼: import java.text.SimpleDateFormat; import java.util.Date; public class DateUtil
前端頁面播放 rtmp 流與 flv 格式視頻文件
media ready nbsp 元素 gif .class create ckplayer -s 技術 :angular/cli , html5 , typescript , scss ,es 6 ... 項目類型:直播視頻與視頻回放 使用到 插件 : videojs +
golang結構體與json格式串
package main import ( "encoding/json" "fmt" ) type IT struct { //一定要注意這裡的成員變數的名字首字母必須是大寫 Company string Subjects []string Isok bool Price
Intel格式與Motorola格式的區別
文章出處:http://blog.csdn.net/ppdyhappy/article/details/52700464 Intel低位元組在前 Motorola高位元組在前 在進行CAN匯流排通訊設計或者測試過程中,經常看到
JS實現隨機顏色的3種方法與顏色格式的轉化
JS實現隨機顏色的3種方法與顏色格式的轉化 隨機顏色和顏色格式是我們在開發中經常要用到的一個小功能,網上相關的資料也很多,想著有必要總結一下自己的經驗。所以這篇文章主要介紹了JS實現隨機顏色的3種方法與顏色格式的轉化,需要的朋友可以參考借鑑,下面來一
影象RGB2YUV與YUV2RGB格式互轉介紹
1 YUV格式與RGB格式說明 由於不同國家的電視訊號系統支援的影象格式不同,有YUV格式成像,也有RGB格式成像,因此為了保證相容性,需要進行RGB與YUV格式的互轉。 另外YUV格式具有亮度資訊和色彩資訊分離的特點,但大多數影象處理操作都是基於RGB格式,需要將RGB格式轉
資料基礎---《利用Python進行資料分析·第2版》第6章 資料載入、儲存與檔案格式
之前自己對於numpy和pandas是要用的時候東學一點西一點,直到看到《利用Python進行資料分析·第2版》,覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。 訪問資料是使用本書所介紹的這些工具的第一步。我會著重介紹pandas的資料輸入與輸出,雖然別的庫中也有不少以此為目的的工具
js moment時間戳與時間格式相互轉換
var moment = require('moment') 獲取時間戳 : var res = moment(Date.now(), 'YYYY-MM-DD HH:mm:ss').valueOf(); 獲取格式時間: var res = moment(Date.n
MySQL時間戳與日期格式的相互轉換
MySQL時間戳與日期格式的相互轉換,PHP時間戳與日期格式的相互轉換 MySQL: 獲取當前時間 SELECT NOW(); // 2018/10/11 14:22:51 時間日期格式轉換成時間戳格式,UNIX_TIMESTAMP()
合併並轉化一代測序seq純文字為fasta格式檔案
use strict; use warnings; my @dir; my @filelist; open OUT, ">result.fst"; opendir (DIR, "./") or die "can't open the directory!"; @dir = read
reads count檔案轉化為fasta格式檔案(redundant reads)
從NCBI下載的測序資料很多是去過接頭的,並且整理成readscount格式,即每行第一列為reads,第二列為reads數,而我們需要把它整理成fasta格式,並且每個read都整理為一條序列 原始檔案: cat GSM3124755_WTB_PARE.csv | h