1. 程式人生 > >Nature Method:DEMIC——使用巨集基因組資料預測細菌的生長速率

Nature Method:DEMIC——使用巨集基因組資料預測細菌的生長速率

文章目錄


image

基於多巨集基因組樣本的細菌生物動態定量和比較

Quantifying and comparing bacterial growth dynamics in multiple metagenomic samples

Nature Methods, [26.919], Article, 2018-11-12

原文連結: https://www.nature.com/articles/s41592-018-0182-0

第一作者:Yuan Gao

通訊作者:Hongzhe Li

主要單位:賓西法尼亞大學,Perelman醫學院,流行病與生統系

摘要

準確定量沒有完整序列的微生物生長動態是具有生物學意義的,但在巨集基因組計算中存在挑戰。我們提出了微生物群體動態估計軟體DEMIC(https://sourceforge.net/projects/demic/DEMIC),可以基於多個巨集基因組樣本的重複的contigs和覆蓋度的值準確比較細菌的生長速度。本軟體在不同測序量樣本和多個直實或人工模擬樣本中表現穩定。

正文

圖1.DEMIC的計算流程

image

a. 基於分箱(binning)演算法鑑定的重疊群(contig)組,基因組的位置、潛在的汙染(圖中不同顏色)是未知的;
b. 採用滑窗法計算重疊群的覆蓋度(coverage,也稱測序深度sequencing depth);
c. 採用線性混合效應模型(linear mixed-effects models, LMM)對GC偏好進行迭代校正,使用PCA距離進行汙染重疊群過濾;
d. 結合樣本和重疊群集,基於有意義的樣本估計生長速度。虛線表示不同樣本中重疊群覆蓋度對數轉換的線性迴歸,可以從重複來源推斷相對距離;
e. 方法應用於每個重疊群組(bin)。NA代表無法估計物種生長率的樣本。

圖2.基於三個物種測序資料集的效果評估

image

a,b 在36個E. faecalis(a)資料集和50個 C. rodentium資料集(b)相關估計DEMIC和iRep的PTR值。陰影表示99%的置信區間。
c,d,評估DEMIC和iRep在重疊群組中的汙染率©和完整度(d)。基於L. gasseri, E. faecalis, C. rodentium (每個樣本n= 10)估計樣本大小和疊連群組的完整性和汙染率。繪製評估的相關性圖,箱線圖展示中位數、第1和3分位數。

圖3.基於5個屬45個相關物種的模擬資料評估DEMIC

image

a, 模擬PTR的估計數;
b, PTR與DEMIC估計41個疊連群簇相關;
c, 基於不同ANI物種組評估iRep和DEMIC結果(樣本數1917,按ANI值劃分為66-74,74-82和82-90三種相似各度)。雙尾Mann–Whitney U-tests, *P< 0.05, **P< 0.01, ***P< 0.001. b,c 箱線圖展示中位數、第1,3分位數。
d, 基於41個物種的DEMIC和iREP估計的皮爾森相關係數。子圖展示兩種方法相應的PTR大於0.9。

熱心腸總結

① 在巨集基因組中準確定量沒有完整序列的微生物生長動態具有重要意義但充滿挑戰;

② DEMIC 基於多樣本巨集基因組中重疊群和覆蓋度的值,通過評估重疊群相對於複製原點的間距,準確比較樣品間細菌生長速率的差異;

③ DEMIC 在不同樣本大小和組裝質量的模擬和真實資料中表現良好,好於既有的 iRep 方法,與 PTRC 方法相當(但該方法僅適用於有完整基因組的物種);

④ DEMIC 使用 Perl 和 R 語言開發,以命令列模式執行,通過 GPL 協議釋出。

Reference

軟體主頁 https://sourceforge.net/projects/demic/files/

猜你喜歡

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了“巨集基因組”專業討論群,目前己有國內外2600+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註“姓名-單位-研究方向-職稱/年級”。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍末解決群內討論,問題不私聊,幫助同行。
image

學習擴增子、巨集基因組科研思路和分析實戰,關注“巨集基因組”
image

image

點選閱讀原文,跳轉最新文章目錄閱讀
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA