NC:MetaSort通過降低微生物群落複雜度以突破巨集基因組組裝難題
點評:目前本領域研究最大的問題是缺少大量細菌基因組作為參考巨集基因組序列。這一問題嚴重限制了研究的準確度和進一步功能研究。而目前的研究還主要集中在擴增子和巨集基因組資料的巨集觀描述上,即使釋出了大量巨集基因組資料並沒有推動本領域高質量參考基因組資料的積累。
本文的分析方法正是為解決此問題,研究巨集基因資料同時獲得大量高質量的新物種基因組,即推動本領域的基礎資料積累,也定能為研究結果增色不少。
文章作者簡介
這篇文章為趙方慶團隊獨立完成,今年發表在Nature Communication上。趙老師是中科院北京生科院的研究員,之前人事關係在中科院遺傳發育所(現轉至動物所),集體活動經常見面;而且我的導師經常請趙老師指導組內學生的各類開題、中期、答辯等活動。
趙老師主要研究方向有基因組變異與精準醫學、環形非編碼RNA組學、巨集基因組技術與人體健康三塊。每塊都做的非常好,具體成果詳見引文的趙老師個人主頁。
單看巨集基因組領域,近兩年趙老師已經發表了7篇高水平文章。
今天我把趙老師最新方法學文章解讀筆記分析給大家。
摘要
當今大多數巨集基因組分析方法依賴參考基因組。而新微生物群落的組成遠超參考基因庫,從頭組裝巨集基因組仍然存在巨大挑戰。
我們提出一種實驗和分析的工作流程 – metaSort,可以從巨集基因組樣品中有效構建細菌基因組。MetaSort方法基於流式細胞術和單細胞測序提供排序的迷你巨集基因組方法,並依賴有效的演算法從巨集基因組中重構高質量的基因組。基於廣泛的比較,MetaSort方法在基因組重構和組裝上表現極wffg且無偏。
更進一步,我們應用MetaSort分析海藻表面末知的微生物群落,一次性成功重構了75個高質量的基因組。此方法將極大的改進複雜微生物組群體的認識和分析。
主要結果
圖1. MetaSort技術路線
第一,提取巨集基因組DNA並測序,將測序結果組裝成重疊群(contigs)。然後,這些contig稱作meta-O,用於構建重疊群連線圖(點代表contig,邊連線兩個可重疊的contigs)。第二,使用流式細胞儀(FCM)對樣品進行分離,比如按微生物細胞大小或其它屬性。對於每一個分離的子集,提取DNA,並採用單細胞測序(MDA)的方法擴增和測序。結果採用SPAdes assembler軟體進行組裝。基於每個子集組裝的contig稱作meta-S,並採用分箱演算法(BAF)進行組裝為基因組。第三,採用機器學習與圖形組裝演算法(MGA),對子集的基因組進一步完善,獲得目標基因組。
圖2. 應用MetaSort研究口腔微生物組
(a) meta-O和metaS在各物種中的測序深度(熱圖)和基因組的覆蓋度(柱狀圖)。混合組裝後NGA75(類似N90)提高的倍數。(b) MGA組裝中三個關鍵步驟的敏感性評估。(c) 組裝中目標序列的組裝和汙染的過濾評估。(d) 以Prevotella salivae為例演示基因組重建的過程。綠色結點代表種子contigs,它與meta-S中靶基組匹配,它在meta-O中進行擴充套件的步驟用橙色節點表示。此外,在連線步驟,採用路徑延伸來重建目標contigs,藍色節點為無法重建的目標contigs (e) Prevotella salivae的contig連線圖。
圖3. 腸道巨集基因組樣本分析菌株水平變異
(a) 最高的5個株菌的NGA75值和基因組覆蓋度增加值;(b) 氣泡密度和相似度分佈展示菌株水平差異; (c) 存在株水平差異的菌:採用柱狀圖展示Alpha多樣性,和箱線圖展示氣泡距離。 (d) 比較腸道和口腔中某些菌的距離,發現單株水平存在顯著差異。
圖4. 重建海藻細菌基因組的進化樹和組裝驗證
(a) 組裝的75個細菌基因組進化上分為五個門。基因組主要來自7個科,而且用顏色高亮標出,此外仍有一些PhyloPhlAn無法分科的物種。每個基因組的完整度和N50分別用餅圖和熱圖展示。 (b-e) 採用PacBio驗證組裝的基因組。PacBio reads採用BLASR比對至基因組。當比對的序列採用比對長度和序列相似度過濾後,序列可按比對結果分為四類。(b) 比對後序列分類情況比例 (c) 唯一比對位置的分類情況 (d) 排除4%不確定的序列,其它的序列平均長度很短 (e) 多基因組中共有的序列比對長度
圖5. 重建海藻細菌基因組的功能
(a) 海藻KEGG與腸道和海樣差異比較;(b) 水平轉移基因的EGGNOG功能; (c) 比較CAZyme基因;(d) 異常示Planctomycetaceae菌科的基因組大小和CAZyme基因密度
02-08 熱心腸日報
趙方慶團隊:突破巨集基因組組裝難題的新方法MetaSort
原標題:MetaSort通過降低微生物群落複雜度以突破巨集基因組組裝難題
① 大部分分析巨集基因組資料的現有方法有賴於參考基因組,而新的微生物群落的數量遠遠超出參考資料庫的覆蓋範圍,從複雜的微生物群落做從頭合成的巨集基因組組裝仍然是巨大挑戰;② 研究者建立了新的實驗和生物資訊學平臺MetaSort,用於巨集基因組樣本中細菌基因組的有效組裝;③ MetaSort提供基於流式細胞儀和單細胞測序方法學的分類迷你巨集基因組方法,並採用新的計算演算法以有效地從分類迷你巨集基因組並結合原始巨集基因組中重建高質量基因組;④ MetaSort在基因組重建和組裝中表現優異且無偏性,利用它分析在一種海藻表面定殖的未被探究的菌群,一次性成功重建75個高質量基因組。
英文摘要
Nature Communications [IF:12.124]
MetaSort untangles metagenome assembly by reducing microbial community complexity
DOI: 10.1038/ncomms14306
Abstract:
Most current approaches to analyse metagenomic data rely on reference genomes. Novel microbial communities extend far beyond the coverage of reference databases and de novo metagenome assembly from complex microbial communities remains a great challenge. Here we present a novel experimental and bioinformatic framework, metaSort, for effective construction of bacterial genomes from metagenomic samples. MetaSort provides a sorted mini-metagenome approach based on flow cytometry and single-cell sequencing methodologies, and employs new computational algorithms to efficiently recover high-quality genomes from the sorted mini-metagenome by the complementary of the original metagenome. Through extensive evaluations, we demonstrated that metaSort has an excellent and unbiased performance on genome recovery and assembly. Furthermore, we applied metaSort to an unexplored microflora colonized on the surface of marine kelp and successfully recovered 75 high-quality genomes at one time. This approach will greatly improve access to microbial genomes from complex or novel communities.
First Authors:
Peifeng Ji
Correspondence:
Fangqing Zhao
All Authors:
Peifeng Ji,Yanming Zhang,Jinfeng Wang,Fangqing Zhao
2017-01-23Article
Reference
想了解更多16S/ITS/18S擴增子、巨集基因組、巨集轉錄組文獻閱讀和分析相關文章,快關注“巨集基因組”公眾號,乾貨第一時間推送。
系統學習生物資訊,快關注“生信寶典”,那裡有幾千志同道合的小夥伴一起學習。