1. 程式人生 > >QIIME 2使用者文件. 9資料匯出Exporting data(2018.11)

QIIME 2使用者文件. 9資料匯出Exporting data(2018.11)

文章目錄

前情提要

QIIME 2使用者文件. 9資料匯出

https://docs.qiime2.org/2018.11/tutorials/exporting/

Exporting data

注:最好按本教程順序學習,想直接學習本章,至少完成本系列1簡介和安裝

為了使用qiime 2,輸入資料必須儲存在qiime 2物件(即qza檔案)中。這就是支援分散式和自動來源跟蹤以及語義型別驗證和資料格式之間的轉換的需要(有關qiime 2物件的更多詳細資訊,請參閱核心概念頁)。

有時,您需要從qiime 2物件中匯出資料,例如使用不同的微生物組分析程式分析資料,或在R中進行統計分析。這可以通過使用qiime匯出命令來實現,該命令以qiime 2物件(.qza)檔案和輸出目錄作為輸入。物件中的資料將根據特定物件匯出一個或多個檔案。

警告: 當從qiime 2物件匯出資料時,將不再有與資料相關的來源。如果隨後重新匯入資料,則與新物件關聯的源將從匯入步驟開始,並且所有現有的來源資訊都將丟失。因此,最好只在使用qiime 2完成所有可以實現的處理步驟後,再從物件中匯出資料,以最大化每個物件來源的追溯。

以下部分提供了從qiime 2物件匯出資料的示例。可以從任何qiime 2物件或視覺化中匯出資料;該過程與下面描述的過程相同。

詳者注:為什麼要匯出檔案?
QIIME2採用統一qza檔案格式,是為了保證檔案格式統一和分析流程可追溯。但不可能要求每個人都用此需系統,而且此係統的功能也不是萬能的,需要匯出其它軟體相容的格式,方便交流和其它使用者更個性化的分析。

# Miniconda安裝的請執行如下命令載入工作環境
source activate qiime2-2018.11

# 如果是docker安裝的請執行如下命令,預設載入當前目錄至/data目錄
# docker run --rm -v $(pwd):/data --name=qiime -it  qiime2/core:2018.11

# 建立工作目錄
mkdir -p qiime2-exporting-tutorial
cd qiime2-exporting-tutorial

匯出特徵表

Exporting a feature table

匯出FeatureTable[Frequency]物件為BIOM v2.1格式

wget \
  -O "feature-table.qza" \
  "https://data.qiime2.org/2018.11/tutorials/exporting/feature-table.qza"
  
qiime tools export \
  --input-path feature-table.qza \
  --output-path exported-feature-table

匯出的biom檔案位於exported-feature-table資料夾中,名為feature-table.biom,可用biom程式對檔案進行格式轉換和分析

匯出進化樹

Exporting a phylogenetic tree

匯出Phylogeny[Unrooted]物件為newick格式

wget \
  -O "unrooted-tree.qza" \
  "https://data.qiime2.org/2018.11/tutorials/exporting/unrooted-tree.qza"
  
qiime tools export \
  --input-path unrooted-tree.qza \
  --output-path exported-tree

導檔案為exported-tree/tree.nwk,是標準樹nwk檔案

(((New.CleanUp.ReferenceOTU1480:0.11995,(New.CleanUp.ReferenceOTU202:0.04479,
New.CleanUp.ReferenceOTU432:0.0049)0.769:0.04661)1:0.26705,
((New.CleanUp.ReferenceOTU1150:0.00016,(New.CleanUp.ReferenceOTU782:0.04264,(New.CleanUp.ReferenceOTU643:0.10438,
(((New.CleanUp.ReferenceOTU1014:0.01521,New.CleanUp.ReferenceOTU270:0.02738)0.879:0.02315,(((New.CleanUp.ReferenceOTU1008:0.0378

匯出與提取

Exporting versus extracting

提取包括所有的資訊檔案,如下例中的特徵表文件,結果即包括特徵表,又包括生成此檔案的相關軟體版本資訊,還有生成此檔案所有步驟的檔案說明。

mkdir extracted-feature-table
qiime tools extract \
  --input-path feature-table.qza \
  --output-path extracted-feature-table

解壓目錄包括一個物件編號UUID的目錄,裡面有所有檔案。

推薦使用 https://view.qiime2.org 線上檢視結果,可以圖形化展示分析流程的追溯。

Reference

Bolyen E, Rideout JR, Dillon MR, Bokulich NA, Abnet C, Al-Ghalith GA, Alexander H, Alm EJ, Arumugam M, Asnicar F, Bai Y, Bisanz JE, Bittinger K, Brejnrod A, Brislawn CJ, Brown CT, Callahan BJ, Caraballo-Rodríguez AM, Chase J, Cope E, Da Silva R, Dorrestein PC, Douglas GM, Durall DM, Duvallet C, Edwardson CF, Ernst M, Estaki M, Fouquier J, Gauglitz JM, Gibson DL, Gonzalez A, Gorlick K, Guo J, Hillmann B, Holmes S, Holste H, Huttenhower C, Huttley G, Janssen S, Jarmusch AK, Jiang L, Kaehler B, Kang KB, Keefe CR, Keim P, Kelley ST, Knights D, Koester I, Kosciolek T, Kreps J, Langille MG, Lee J, Ley R, Liu Y, Loftfield E, Lozupone C, Maher M, Marotz C, Martin BD, McDonald D, McIver LJ, Melnik AV, Metcalf JL, Morgan SC, Morton J, Naimey AT, Navas-Molina JA, Nothias LF, Orchanian SB, Pearson T, Peoples SL, Petras D, Preuss ML, Pruesse E, Rasmussen LB, Rivers A, Robeson, II MS, Rosenthal P, Segata N, Shaffer M, Shiffer A, Sinha R, Song SJ, Spear JR, Swafford AD, Thompson LR, Torres PJ, Trinh P, Tripathi A, Turnbaugh PJ, Ul-Hasan S, van der Hooft JJ, Vargas F, Vázquez-Baeza Y, Vogtmann E, von Hippel M, Walters W, Wan Y, Wang M, Warren J, Weber KC, Williamson CH, Willis AD, Xu ZZ, Zaneveld JR, Zhang Y, Zhu Q, Knight R, Caporaso JG. 2018. QIIME 2: Reproducible, interactive, scalable, and extensible microbiome data science. PeerJ Preprints 6:e27295v2 https://doi.org/10.7287/peerj.preprints.27295v2

譯者簡介

劉永鑫,博士。2008年畢業於東北農大微生物學專業。2014年中科院遺傳發育所獲生物資訊學博士學位,2016年博士後出站留所工作,任巨集基因組學實驗室工程師,目前主要研究方向為巨集基因組學、資料分析與可重複計算和植物微生物組、QIIME 2專案參與人。發於論文12篇,SCI收錄9篇。2017年7月創辦“巨集基因組”公眾號,目前分享巨集基因組、擴增子原創文章400+篇,代表博文有《擴增子圖表解讀、分析流程和統計繪圖三部曲》,關注人數3.2萬+,累計閱讀500萬+。

猜你喜歡

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了“巨集基因組”專業討論群,目前己有國內外3000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註“姓名-單位-研究方向-職稱/年級”。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍末解決群內討論,問題不私聊,幫助同行。
image

學習擴增子、巨集基因組科研思路和分析實戰,關注“巨集基因組”
image

image

點選閱讀原文,跳轉最新文章目錄閱讀
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA