1. 程式人生 > 實用技巧 >文獻閱讀 | Worldwide phylogeography and history of wheat genetic diversity

文獻閱讀 | Worldwide phylogeography and history of wheat genetic diversity

Balfourier F, Bouchet S, Robert S, et al. Worldwide phylogeography and history of wheat genetic diversity[J]. Science advances, 2019, 5(5): eaav0536.

通過採用high-density Affymetrix Axiom SNP array對4506個landracecultivar進行基因分型,作者獲得了一個包含280226個SNP的資料集,並在進一步篩選後得到了113457個高質量SNP。這些高質量SNP包含99,333個多型性高解析度(PHR)雙等位基因SNP和14,124個脫靶變異體(OTV)(同時檢測核苷酸多型性和存在缺失變異的標記)。通過IWGSC v1.0,作者確定了這些SNP在基因組上的位置。

目錄

單倍型分析

單倍型分析將基因型解析為8741個較大的區域。作者用單倍型塊進行樣本距離計算髮現,相對於直接用SNP,單倍型算出的相似度低很多。作者認為是等位基因數量更多(尤其是稀有的)導致單倍型算出的相似度較低,並猜想這或將有利於展示SNP難以追蹤的近期的變異。單倍型塊的數量與每個染色體中SNP總數高度相關。每個單倍型塊的型別總數均值為4,在2-20之間。單倍型塊的中位大小為105
Kb,並由85%的塊小於1Mb,均值863 ± 4595 kb。這個巨大的SD反映了小麥染色體的結構劃分。

單倍型計算中,首先用Beagle軟體估計缺失的資料,並刪除丟失資料超過5%的行。使用PLINK中的Haploview演算法區分單倍型。In each haplotypic block, 95% of pairwise measures of marker LD (D′) were superior to 0.98.

群體結構

STRUCTURE分析顯示,K=6至9時分組更為穩定。作者接著介紹了K=2至K=8時的分組概況。下圖中,對角線顯示了分組內稀有等位基因數量(頻率<0.05),對角線上方是\(F_{ST}\),下方是兩個種群重疊的稀有等位基因數量。

\(F_{ST}\)採用hierfstat R package計算。

地理對映

PCoA的第一軸和第二軸地理投影顯示,存在兩個分化極,一個在歐洲,一個在亞洲。它們都在地中海地區匯聚,這與有關將小麥馴化置於新月沃地的文獻一致。距新月的遺傳和地理距離之間的關係支援這樣一個事實,即有兩個分化源於一個共同的中心:新月(圖S3)。通過對稀有等位基因的研究,作者認為,小麥的擴張可能始於地中海地區。然後,麵包小麥在新的環境中沿兩條主要的人類遷徙路線進行了分化,從新月沃地走向歐洲(沿多瑙河路線向北(SEE)和向西(NWE))以及沿絲綢之路走向亞洲。

PCoA採用Kriging method得出。The spatial prediction is based on a Gaussian model.軟體採用了TESS3。

系統發育分析與單倍型分析

系統發育樹顯示了三個大基因池。東歐和地中海的基因池中有包含了94%的SEE, MED, and IBP landraces,其中包含所有傳統和現代多樣性中83%的、不是來自北歐和西歐的部分。現代品系和亞洲地方品種之間的高分化指數(SEA和INP;平均\(F_{ST}\) = 0.35)支援以下事實:原始的亞洲多樣性庫對現代品種沒有太大貢獻。同時,作者發現北歐和西歐的育種計劃主要使用當地的地方品種。

通過各國、各地區主要單倍型群(歐洲、MED、中東與中亞、東南亞、中國、非洲等),作者講述了各地育種的故事。

下圖展示了各品種(時期)間遺傳多樣性的改變。圖中,A是世界範圍,B是歐洲範圍,C是中國範圍。

結構變異與小麥育種

對OTV分佈的詳細分析顯示,大於5 Mb的80多個SV塊,累計長度大於4600 Mb,即幾乎佔整個麵包小麥基因組的三分之一(表S5)。這些大塊可能對應於外來的基因滲入,如1BL/1RS易位、[偏凸山羊草2NS易位染色體上2A](https://doi.org/10.2135/cropsci2003.1839)等。但由於本文方法原因,小外來片段(稱為cryptic introgressions)難以被檢測。因此,當前小麥種質中存在的外來DNA總量可能遠遠大於該數量。

由於馴化和選擇,改良材料中的SNP自然遺傳多樣性顯著低於在地方品種中觀察到的SNP自然遺傳多樣性。然而,與本地品種相比,現代品種中丟失了9%的等位基因,而現代品系中發現了8%的新等位基因。這些現代基因特有的等位基因中有19%含有OTV,而地方品種特有的等位基因只有7%。這表明育種計劃帶來了一些與外來基因滲入有關的富含SV的新等位基因,從而導致總體遺傳多樣性與地方品種和現代品種相似。

作者對面包小麥的介紹

麵包小麥(Triticum aestivum L.)是一種異源六倍體物種,起源於連續兩輪雜交。第二個雜交事件被認為是新石器時代期間都發生在新月沃地,〜8000至10000年前(1,2)。然後,麵包小麥種質沿著古老的人類遷徙道路進化。從現在開始,該地區的第一批農民從8500到2300一直向西傳播到歐洲,再向東傳播到亞洲(3)。在歐洲和亞洲傳播後,馴化的小麥種群已適應當地環境,成為所謂的地方品種。從16世紀開始,麵包小麥被引入新世界,首先是在拉丁美洲,然後在北美和澳大利亞(3)。在過去的兩個世紀中,在歐洲和亞洲組織了育種計劃,以改善這些地方品種。最後,第二次世界大戰後,綠色革命期間農作物(特別是小麥)中矮化基因的引入,導致了全世界基因庫的顯著改變(4)。如今,小麥每年生產超過2.2億公頃,近750公噸,是世界上耕種和消費最多的農作物之一,每天提供15%的卡路里消耗。自從狩獵聚會向農業過渡以來,麵包小麥對文明的興起至關重要。通過反覆選擇來適應人們的需求並適應不同的環境。在這裡,我們報告了一項全球植物地理學研究,旨在瞭解小麥傳播和分化的這一複雜歷史。

樣本

4506個品系選自Institut National de la Recherche Agronomique (INRA) Biological Resources Center收集的12000個品系。選擇結合了前人的研究

每個accession的詳細資訊見Data file S1

基因分型

作者通過Affymetrix GeneTitan system平臺執行了分型操作,並通過修改過的Affymetrix Power Tools 和SNPolisher來執行allele calling環節,以適配小麥基因組的特點。對於所有SNP,作者計算了HomRO和HomFLD,並以3.6作為HomFLD閾值進行過濾。資料處理上,探針雜交之後,沒有通過質量檢查的SNP被重新處理。被SNPolisher分入OTVs的探針集被OTV_caller進行了兩步分析。SNP被Affymetrix software通過cluster patterns分為6組:PHR, OTV, monomorphic high resolution, no minor homozygous, call rate below threshold, and others。只有 PHRs and OTVs被用於後續研究