bioperl 自動化下載genbank 中的序列

阿新 • • 發佈：2017-06-13

bio sca 1-1 接受分享 .org gen weight org

當我們想要從genbank 中下載序列的時候，總需要點擊右上角的download 按鈕，選擇對應的格式，然後通過瀏覽器進行下載，這樣反復的點擊很費時間了

其實可以通過bioperl 自動化的完成下載；

代碼如下：

#!/usr/bin/env perl
use Bio::SeqIO;
use Bio::DB::GenBank;


my ($acc, $out_dir) = @ARGV;

die "Usage:perl $0 <acc_number> <out_dir>\n" if scalar @ARGV != 2;


system qq{mkdir -p $out_dir 
} if not -d $out_dir;

my $seq_obj = retriev_seq($acc);

download_seq($seq_obj, ‘fasta‘,   qq{>$out_dir/sequence.fasta});
download_seq($seq_obj, ‘genbank‘, qq{>$out_dir/sequence.gb});


sub retriev_seq
{
    my $acc = shift;
    my $db_obj  = Bio::DB::GenBank->new;
    my $seq_obj = $db_obj->get_Seq_by_acc($acc 
);

    return $seq_obj;
}

sub download_seq
{
    my $seq_obj = shift;
    my $fmt     = shift;
    my $out     = shift;

    my $seqio_obj = Bio::SeqIO->new(-file => $out, 
                                  -format => $fmt );

    $seqio_obj->write_seq($seq_obj);
}

這個腳本接受兩個參數，第一個參數為序列對應的編號，第二個參數為輸出的目錄

以 https://www.ncbi.nlm.nih.gov/nuccore/NC_024541.1 為例：

通過瀏覽器下載是這個樣子的：

技術分享

點擊Send 按鈕，在彈出的對話框中選擇下載的序列的區間，對應的格式

通過腳本下載是這個樣子的，首先得到序列對應的編號，如下圖所示：

技術分享

然後運行下面的命令：

perl download_reference.pl NC_024541 ./

這樣通過序列對應的編號就可以自動化的下載對應的序列了

其實，bioperl 當中還提供了其他的檢索序列的方式，比如按照 gi號，功能非常強大。

參考資料：

http://bioperl.org/howtos/Beginners_HOWTO.html

bioperl 自動化下載genbank 中的序列

bio sca 1-1 接受分享 .org gen weight org 當我們想要從genbank 中下載序列的時候，總需要點擊右上角的download 按鈕，選擇對應的格式，然後通過瀏覽器進行下載，這樣反復的點擊很費時間了其實可以通過bioperl 自動化的完成下載

使用git命令下載倉庫中的代碼

使用 images 安裝 ubuntu 版本 ubunt .com git命令 sta git是一種免費開源的分布式版本控制器。好像不能在頁面點擊下載源代碼。在Ubuntu下，安裝git工具。 sudo apt install git 使用命令下載 git clon

在.net中序列化讀寫xml方法的總結

port 單詞創建 padding 在一起 sys base msd 屏幕在.net中序列化讀寫xml方法的總結閱讀目錄開始最簡單的使用XML的方法類型定義與XML結構的映射使用 XmlElement 使用 XmlAttribute 使用 Inner

Unity中序列化和反序列化

private ons 並且行修改 ges 面向對象我們為我 -1 為了滿足面向對象中的封裝性，我們通常使用private關鍵字使變量私有化，讓外界無法訪問修改，起到保護作用。但是一些特殊情況，我們希望在Unity中Inspector面板中修改到腳本組件中的私有成員

oracle中序列的使用

oracle序列插入回滾自動 p s 無需 _id 開始 value 序列: 是oacle提供的用於產生一系列唯一數字的數據庫對象。 l 自動提供唯一的數值 l 共享對象 l 主要用於提供主鍵值 l 將序列值裝入內存可以提高訪問效率創建序列： 1、要有創

項目中序列化時,去除屬性為null的key

序列化方法 key 技術分享 bean 過濾註解 ima pro 項目中對象屬性中的字段有很多時,每次查詢需要的屬性都不同,但是還是返回null,過濾掉為空的方法 1.@JsonIgnore標簽此註解用於方法或者屬性上(最好就是用在屬性上),作用就是在對象做序列化時過

Json.Net 在.Net Core 2.0 中序列化DataSet 問題

序列化問題 name 一個信息 blog 內容 dataset 分享使用Asp.Net Core中自帶的版本10.0.1 生成一個簡單的DataSet DataSet ds2 = new DataSet(); DataTable table

自動化測試 selenium中WebDriver 和WebElement的區別

class 輸入方法圖片形參 .com image 關閉兩個之前在做UI自動化測試中經常會用到 WebDriver 和 WebElement兩個類以前對這兩個類總感覺有點傻傻分不清昨天看了下之前下的代碼結合自己的理解對著兩個類的區別和關系整

Java中序列化的好處及意義

eth 對象安全 exce swe 網絡 () exceptio 註意事項 1、序列化是幹什麽的？簡單說就是為了保存在內存中的各種對象的狀態，並且可以把保存的對象狀態再讀出來。雖然你可以用你自己的各種各樣的方法來保存Object States，　但是Java給你提

java 中序列化的作用和好處

java 中序列化的作用和好處 2017年06月21日 01:55:53 雪人先生1234 閱讀數：5652更多個人分類： Java 1、序列化是幹什麼的？簡單說就是為了儲存在記憶體中的各種物件的狀態，並且可以把儲存的物件狀態再讀出來。雖然你可以

linux下載github中的檔案

linux下載github中的檔案 2018年01月31日 18:55:49 Mr-Cat踏雪三郎閱讀數：644更多個人分類： github 版權宣告：提倡知識共享，可以轉載和使用 https://blog.csdn.net/Mr_Cat123/arti

oracle中序列,同義詞的建立

序列　　序列是用來生成唯一,連續的整數的資料庫物件.序列通常用來自動生成主機那或唯一鍵的值.序列可以按升序排序, 也可以按降序排序.例如,銷售流水錶中的流水號可以使用序列自動生成. 建立序列語法: create sequence sequence_name 　　[START WITH i

java中序列化與反序列化的問題

java序列化是將java物件轉換為位元組序列的過程，變成計算機能夠儲存的二進位制序列反序列化是將位元組序列恢復成java物件的過程 1.當兩個Java程序進行通訊時，能否實現程序間的物件傳送呢？答案是可以的。如何做到呢？這就需要Java序列化與反

自動化監控--zabbix中的郵件報警通知詳解

前言在自動化監控–zabbix安裝和配置詳解我們已經完成了zabbix監控的安裝部署，今天我們就在它的基礎上來實現一下自動監控的郵件報警通知。新增一臺主機首先，新增一臺host 只需填寫Host name、Agent interfaces，併為主機選定一個Groups

自動化監控--zabbix中的Macros（巨集）詳解

巨集 Zabbix支援許多在多種情況下使用的巨集。巨集是一個變數，由如下特殊語法標識： {MACRO} 根據在上下文中，巨集解析為一個特殊的值。有效地使用巨集可以節省時間，並使Zabbix變地更加高效。在一個的典型用途中，巨集可以用於模板中。因此，模板的觸發器可能

自動化監控--zabbix中的template（模板）詳解

模板概述模板是可以方便地應用於多個主機的一組實體。而這些實體包括：items（監控項）、triggers（觸發器），graphs（圖形）、applications（應用）、screens (聚合圖形（自Zabbix 2.0起）)、low-level discovery rules

自動化監控--zabbix中的使用者和使用者組詳解

使用者和使用者組 Zabbix 中的所有使用者都通過 Web 頁面去訪問 Zabbix 應用程式。併為每個使用者分配唯一的登陸名和密碼。所有使用者的密碼都被加密並儲存於 Zabbix 資料庫中。使用者不能使用其使用者名稱和密碼直接登陸到 UNIX 伺服器中，除非他們也被因此建立

abbyy14破解版網盤（附破解補丁百度雲下載）abbyy14序列號生成器

abbyy14破解版網盤下載是OCR辨識軟體，它有著標準的Windows介面，能夠直接在MS Word、MS Excel、WordPerfect及Word Pro中掃描和讀取檔案、信件或各類表格，破解版網盤（附破解補丁百度雲下載）abbyy14序列號生成器能存成RTF、TXT、DOC、CSV、XLS或HTML

[國產PLC]耐特穩定PLC在自動化搬運系統中運用的控制特點

一、裝置簡介因人類生產生活的需要，自動化流水線搬運的應用不斷擴大，成了各大型工廠的必備基礎配套設施。其主要是通過步進電機、 CKD馬達、 SMC電動氣缸、等來組成自動化搬運系統。二、裝置原理自動化搬運系統的三個主要功能是搬送、定位、轉線。步進電機帶動傳送帶，組成傳送系統；CKD馬達和產品

一步步學spark之一scala函式程式設計中序列,可變列表與不可變列表3.2

一步步學spark之一scala函式程式設計中序列,可變列表與不可變列表定義List集合 head就是去列表中第一個元素 tail就是除了第一個元素以外的其他元素列表另一種定義list方法把新的數加入到list中

bioperl 自動化下載genbank 中的序列

相關推薦