通過bed文件獲取fasta序列

阿新 • • 發佈：2018-07-18

技術分享定義 tps -- core 技術 lock 獲取 ref

一、BED 文件格式

BED 文件格式提供了一種靈活的方式來定義的數據行，以用來描述註釋的信息。BED行有3個必須的列和9個額外可選的列。每行的數據格式要求一致。

必須包含的3列：

1.chrom, 染色體名字(e.g. chr3， chrY)

2.chromStart, 目標區段在染色體起始位置，染色體第一個堿基的位置是0

3.chromEnd, 目標區段在染色體結束位置，染色體的末端位置沒有包含到顯示信息裏面。例如，首先得100個堿基的染色體定義為chromStart =0 . chromEnd=100, 堿基的區段是0-99

技術分享圖片

9個可選列

4.name、5.score、6.strand、7.thickStart、8.thickEnd、9.itemRGB、10.blockCount、11.blockSize、12.blockStarts

二、基因組文件下載和seqFasta.py相關依賴包下載

1.基因組文件下載，如人hg38

$ wget http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz

2.seqFasta.py依賴包下載

$ pip install numpy pyfasta

三、運行腳本seqFasta.py得到結果

1.利用geneInfo.py得到bed文件

$ python geneInfo.py -i brca1 -d hg38 -o brca1.bed

2.運行seqFasta.py得到fasta序列

$ python seqFasta.py -g $HG38/hg38.fa -b brca1.bed

技術分享圖片

【參考列表】

UCSC BED format

通過bed文件獲取fasta序列

技術分享定義 tps -- core 技術 lock 獲取 ref 一、BED 文件格式 BED 文件格式提供了一種靈活的方式來定義的數據行，以用來描述註釋的信息。BED行有3個必須的列和9個額外可選的列。每行的數據格式要求一致。必須包含的3列：

第四課：通過配置文件獲取對象（Spring框架中的IOC和DI的底層就是基於這樣的機制）

ted const dex generate stat clas name 必須 nbsp 首先在D盤創建一個文件hero.txt，內容為：com.hero.Hero（此處必須是Hero的完整路徑）接下來是Hero類 package com.hero; publi

java通過讀取本地文件獲取反射方法參數，執行對象方法

invoke 文本 [] run pac 執行 read prop col 運用到的知識點 IO流，集合properties 反射在工程目錄下新建file config.properties #one time only can run one met

Spring Boot通過application.yml配置文件獲取屬性及類信息

boot 實體類 ping override ria pro tid @value attr 實體類信息**@ConfigurationProperties(prefix="mycar")**br/>直接獲取單個屬性@Value("${mycar.carNo}")

RocketMQ 拉取消息-文件獲取

一次 lsi select ice logs sets 數據 public file 看完了上一篇的《RocketMQ 拉取消息-通信模塊》，請求進入PullMessageProcessor中，接著 PullMessageProcessor.processRequest(f

在java項目中怎樣利用Dom4j解析XML文件獲取數據

avi conf get 自己 mar dom4j eas localhost b2c 在曾經的學習.net時常常會遇到利用配置文件來解決項目中一些須要常常變換的數據。比方數據庫的連接字符串兒等。這個時候在讀取配置文件的時候。我們一般會用到一個雷configuratio

MAC通過配置文件連接數據庫

創建 nbsp 輸入格式 fileinput sys pro 文件內容換行 1、準備配置文件： 1? 直接在項目裏面建配置文件：在src文件夾同級，創建一個 conf 文件夾，專門來管理配置文件的； 2? 創建文件 xxx.properties，然後將需要配置的信息

log4j通過配置文件配置即，即可完成系統報錯想向指定郵箱發送提醒消息，網上的很多方法都又問題

name 分享 tor round 郵箱 article eap configure sys 我參考了下面的鏈接去實現，但是遇到了一些問題參考鏈接： 1）http://blog.csdn.net/azheng270/article/details/2173430/ 這個鏈

c# aseembly 反射.dll文件獲取源代碼的結構

init isnull ont eno ren edas forms get tno using System; using System.Collections.Generic; using System.ComponentModel; using System.Dat

如何通過class文件來查看java的版本

如何 ima class 生成通過如果字節 jdk1.5 版本號我們知道class文件是通過javac編譯生成的，如果我們想知道是java的那個版本生成的，該怎麽做？很簡單，Linux下只要使用od命令，如下：前四個字節為固定的cafe babe，接下來的四個

[Spark][Python]spark 從 avro 文件獲取 Dataframe 的例子

imp oca block sql contex local put driver tput [Spark][Python]spark 從 avro 文件獲取 Dataframe 的例子從如下地址獲取文件： https://github.com/databricks/

從Excel、CSV文件獲取數據

amp stat odbc extension public jet trim ace exc #region 從Excel獲取數據 /// <summary> /// 從Excel獲取數據 /// &

網頁靜態動態的區分，js/doc文件獲取

16px log 市場 statement txt 紅色 ont 本地代碼靜態頁面查看源代碼 url：http://www.shfe.com.cn/products/cu/ 目標內容：紅色框中部分將網頁源代碼復制到本地txt，用瀏覽器打開結果：合約信息，國

java基礎 File與遞歸練習使用文件過濾器篩選將指定文件夾下的小於200K的小文件獲取並打印按層次打印(包括所有子文件夾的文件)

tor accep length 按層 col 不存在 args name style package com.swift.kuozhan; import java.io.File; import java.io.FileFilter; /*使用文件過濾器篩選將指定文

Python抓取遠程文件獲取真實文件名

pen AR name position 遠程文件 head con get log 用urllib下載遠程文件並轉存到hdfs服務器，在下載時，下載地址中不一定包含文件名，需要從連接信息中獲取。 1 file_url = request.form.get(

淺談JS中的!=、== 、!==、===的用法和區別 JS中Null與Undefined的區別讀取XML文件獲取路徑的方式 C#中Cookie，Session，Application的用法與區別？ c#反射抽象工廠

main 收集 data- 時間設置 oba ase pdo 簡單工廠模式 1.0 var num = 1; var str = ‘1‘; var test = 1; test == num //true　相同類型　相同值 te

使用VMware通過vmdk文件創建XP虛擬機

選項 ESS microsoft 技術打印 vmware bsp 兼容自定義一、打開VMware workstation10，轉到主頁，選擇“創建新的虛擬機”，然後選擇“自定義（高級）”選項　　　　二、虛擬機硬件兼容性選擇默認兼容10.0模式，下一步之後，選擇“

MongoDB 通過配置文件啟動及註冊服務

-- net 需要 png pat 服務系統服務 path 修改配置 1.配置mongodb環境變量，配置完成之後就可以直接執行mong、mongod等常用命令，不用每次都到mongodb安裝目錄bin下去執行； 2.通過命令啟動mongo服務 mongod --

windows bed文件 boot.ini 文件

nag image ini win 文件 title roc weight cal 1、bcd文件修復2008系統下的bcd文件位置破壞bed文件2、Boot.ini 文件編輯windows bed文件 boot.ini 文件

通過dbf文件恢復oracle

plus ora oracl 10.2.0.1 tle 註冊個數通過實例名可能有些人會由於各種原因經常重裝系統，但是系統裏面總是有一些比較重要的軟件在重裝後就不能用了。比如oracle數據庫，眾所周知數據庫如果通過dmp導入導出麻煩不說，還很耗時，特別是像筆者

通過bed文件獲取fasta序列

相關推薦