1. 程式人生 > >Microbiome:巨集基因組分箱流程MetaWRAP簡介

Microbiome:巨集基因組分箱流程MetaWRAP簡介

文章目錄

MetaWRAP—a flexible pipeline for genome-resolved metagenomic data analysis

題目:MetaWRAP——靈活的巨集基因組資料探勘單菌基因組分析流程

作者:Gherman V. Uritskiy, Jocelyne DiRuggiero* and James Taylor*

單位:約翰斯·霍普金斯大學,生物系

文章於2018年3月6日釋出於bioRxiv上 https://www.biorxiv.org/content/early/2018/03/06/277442 ,9月15日於Microbiome雜誌線上發表

image

熱心腸日報導讀

全能型巨集基因組分析工具:MetaWRAP

Adam劉永鑫-中科院-巨集基因組 10-13 熱心腸日報

原標題:MetaWRAP——靈活的巨集基因組資料探勘單菌基因組分析流程

① MetaWRAP是一款整合了質控、拼接、分箱、提純、評估、物種註釋、丰度估計、功能註釋和視覺化的分析流程,納入超140個工具軟體,可一鍵安裝;

② 流程整合了CONCOCT、MaxBin、 metaBAT等三款分箱工具以及提純和重組裝演算法;

③ 與以上三種工具單獨使用,以及與使用DAS_tool、Binning-refiner相比,分箱結果更佳。

④ 在此基礎上,MetaWRAP還可實現巨集基因組分析從原始資料到結果視覺化的全部流程,同時也可靈活使用各個模組獨立分析,彈性多變。

主編評語
您還在為巨集基因組分析流程繁瑣,所用軟體甚多,安裝使用異常複雜而煩惱嗎?請看這款最新發布的巨集基因組分析全能工具,可幫助您一站式完成質控、分箱、註釋、結果視覺化等全部分析作業。基於Conda,部署方便,使用簡單,需要的話趕快試一下吧。好用的話別忘了在下面留言哦!

摘要

背景

使用巨集基因組測序研究微生物組,可以分析環境中不可培養的微生物群落。提取個體基因組草圖(bins)可以實現巨集基因組的單菌基因組水平分析。這些分析的軟體和流程非常多樣且複雜,對於生物學家來說,使用是一件非常困難的事情,對工作造成非常大的負擔。此外,分箱演算法快速發展,但一直缺少評估和視覺化的工具。

結果

為解決以上挑戰,我們釋出巨集基因組分析流程metaWRAP。MetaWRAP部署了最先進的巨集基因組分析軟體和資料庫,從原始資料直接到巨集基因組bin和相關下游分析。MetaWRAP使用過程又足夠靈活,允許研究人員調整,更重要的是安裝和使用方便。它包括混合演算法,來實現多種軟體分箱結果的整合。在人工重組和自然樣本資料中結果均優於5款主流軟體。最後,metaWRAP還包括物種註釋、丰度估計、功能註釋和視覺化等多個巨集基因組分箱結果的下游分析功能。

結論

MetaWRAP是一款易用的模組化流程,用於分析巨集基因組分析中的核心任務——分箱,顯著改善高質量分箱結果的提取和解析。其中的分箱提純和再組裝功能優於其它分箱方法。流程中的每個模組也獨立執行,增加巨集基因組分析的靈活性。此軟體為開源專案,原始碼見 https://github.com/bxlab/metaWRAP

主要結果

image

圖1. metaWRAP工作流程

圖中紅色代表分析模組,綠色代表巨集基因組資料,橙色代表中間檔案,藍色代表結果圖表。

實現原始序列的質控、物種註釋和視覺化、巨集基因組拼接、三種主流Bin方法分析和結果篩選與視覺化、Bin的重新組裝、Bin的物種和功能註釋等。輕鬆實現Bin相關分析和視覺化的絕大部分需求。

image

圖2. 基於CAMI人工資料集高、中、低資料量下,對6款Bin軟體結果的完整度和汙染率進行評估。結果表明metaWRAP在各種情況下在完整度和汙染率方面都表現更優秀。

關於CAMI資料集的Nature Methods文章,詳見下文:

image

圖3. Blobology模組視覺化水體、腸道和土壤巨集基因組拼接疊連群的GC含量和豐度。

疊連群的丰度計算基於每個樣品中標準化的reads覆蓋度。採用blast註釋疊連群門水平物種資訊

image

圖4. 基於水體、腸道和土壤巨集基因組資料對6款分箱軟體的完整度和汙染率進行評估

原始分箱工具,包括metaBAT2, CONCOCT和MAXBin2;分箱提純工具,包括(DAS_Tool, Binning_refiner和metaWRAP的Bin_refinement模組。僅展示CheckM估計完整度大於50%,汙染率小於10%的bins

image

圖5. 水體、腸道和土壤巨集基因組bins再組裝結果的N50、完整度和汙染率比較

使用metaWRAP的Reassemble_bins模組對原始bins進行二次組裝。僅展示CheckM估計完整度大於50%,汙染率小於10%的bins

image

圖6. 水體、腸道和土壤中高純度bins(汙染率<5%)分別在完整度70%、80%、90%、95%下的數量

MetaWRAP執行在不同最小完整度引數下的結果。

image

圖7. Blobology模組視覺化水體、腸道和土壤巨集基因組拼接疊連群的GC含量和豐度

疊連群的丰度計算基於每個樣品中標準化的reads覆蓋度。圖中按bins進行隨機著色。只顯示70%以上完整度和10%以下汙染Bins。

點評

該軟體的優點:

  1. 安裝方便,一鍵安裝140多個相關軟體;
  2. 流程完善,原來拼接需要自己拼接和準備丰度格式耗時耗力,現在一步全搞定;
  3. 結果優於主流方法;
  4. 視覺化功能強大;
  5. 可對Bin進一步進行物種和功能註釋。

總結:此軟體在手,Binning分析別無所求。

參考文獻

Micribome https://microbiomejournal.biomedcentral.com/articles/10.1186/s40168-018-0541-1

熱心腸日報 https://www.mr-gut.cn/papers/read/1059939857?kf=xread_daily

猜你喜歡

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了“巨集基因組”專業討論群,目前己有國內外2300+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註“姓名-單位-研究方向-職稱/年級”。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍末解決群內討論,問題不私聊,幫助同行。
image

學習擴增子、巨集基因組科研思路和分析實戰,關注“巨集基因組”
image

點選閱讀原文,跳轉最新文章目錄閱讀
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA