人類基因組最後一塊拼圖完成,Science 罕見 6 篇連發
人類基因組測序迎來新的里程碑!首個完整無間隙人類基因組測序,由近百位科學家合作完成,填補上最後 8% 的空缺。最新一期 Science 罕見地以特刊形式連發 6 篇論文,另外兩篇介紹研究方法的論文同日登上 Nature Method。
作者之一、華盛頓大學教授 Evan Eichler 稱:
我們在生命天書中讀到了前所未有的新章節。
回看 2003 年,人類基因組計劃(Human Genome Project) 首次完成 92% 的人類基因測序,創造了歷史。到如今,新成立的端粒到端粒聯盟(T2T Consortium) 填補上最後 8% 的空缺,同時糾正了之前的一些錯誤,也將載入史冊。
△T2T 聯盟部分成員
新確認的 8% DNA 片段裡包含重要的免疫反應基因,它們幫助人類適應和抵禦病毒和細菌感染,在預測藥物反應方面很有價值。
聯盟發起人之一、馬里蘭大學的 Adam Phillippy 認為,個人基因組測序在 10 年內有望普及,個性化醫療成本會大幅下降。
另外新發現的基因中有一些使得人類大腦比其他靈長類動物大腦更大,有助於進一步揭開人類進化之謎。
攻克最後的 8%
當初的人類基因組計劃由 6 國近 2000 位科學家耗時 13 年完成,最後遺留的 8% 靠當時的測序技術難以突破。原因有二:
其一,最後的 8% 裡有很多片段是重複的。科學家們用拼圖來形容這一困難。如果拼圖裡好多小塊很相似就更難找到正確的位置。近幾年發展出的新測序方法 Oxford Nanopore 和 PacBio HiFi 可以一次處理更長的 DNA 片段,就好像拼圖的塊變大,塊數變小了。
其二,很難找到只有一套 DNA 的人類細胞。正常細胞同時擁有兩套 DNA,分別來自父親和母親,測序時兩組 DNA 混在一起增加了難度。這次的解決辦法是使用一組來自“葡萄胎”的細胞,這是一種罕見妊娠疾病,使胚胎細胞異常生長,只保留一套 DNA。
用上新方法,人類 DNA 序列中 30.55 億個鹼基對的測序工作終於宣告完工。人類基因組計劃前負責人 Robert Waterston 對新方法評價到:
(人類基因組)不再有任何隱藏的或未知的部分。
全新的人類參考基因組被命名為 T2T-CHM13,今後的個性化基因測序可以此為基準,鎖定病變基因,提前預防和治療。
這次研究成果幾個月前已釋出在生物預印本平臺,現在正式見刊 Science。具體到已發表的內容上,還存在一點不足之處:使用的葡萄胎細胞保留的是 XX 染色體,缺失了 Y 染色體。
不過後來這段時間科學家們也沒閒著,Y 染色體的測序工作其實也另外完成了。專案負責人 Adam Phillippy 在社交媒體宣佈了這一訊息,人體 24 條染色體基因測序已全部完成。
最新參考序列 T2T-CHM13 v2.0 的完整資料和線上瀏覽器已公開,可供全球研究團隊使用。
而最新包含 Y 染色體測序成果的論文預印版計劃在下個月釋出。
論文地址:
https://www.science.org/toc/science/376/6588
CHM13 v2.0 相關資料和工具
https://genomeinformatics.github.io/CHM13v2/