1. 程式人生 > 實用技巧 >Post-GWAS: eQTL、mQTL共定位分析(Summary-data-based Mendelian Randomization,SMR)

Post-GWAS: eQTL、mQTL共定位分析(Summary-data-based Mendelian Randomization,SMR)

1、eQTL、mQTL共定位分析的作用

eQTL、mQTL共定位分析屬於Post-GWAS的一項重要工作,旨在GWAS結果的基礎上鑑定與表型相關的eQTL和mQTL位點。

傳統的GWAS是將全基因組範圍內的常見變異進行關聯分析,鑑定與表型相關的基因座,但鑑定出來的位點大多數位於基因間隔區,其如何通過基因或者通路影響表型很難被闡述。

基於此,開發了eQTL、mQTL共定位分析方法。

其原理是利用已有資料庫公佈的eQTL、mQTL位點,結合GWAS summary資料,鑑定與表型相關的eQTL和mQTL位點。

2、eQTL共定位分析

下載安裝SMR:

wget https://cnsgenomics.com/software/smr/download/smr_Linux.zip

unzip smr_Linux.zip

下載eQTL資料(注意我這裡下載的是hg19版本的,如果你的GWAS資料不是hg19,請自行更改對應的基因組版本的資料):

資料來源https://cnsgenomics.com/software/smr/#eQTLsummarydata

wget https://cnsgenomics.com/data/SMR/westra_eqtl_hg19.zip

unzip westra_eqtl_hg19.zip

wget https://cnsgenomics.com/data/SMR/cage_eqtl_data_lite_hg19.tar.gz

tar -zxvf cage_eqtl_data_lite_hg19.tar.gz

wget https://cnsgenomics.com/data/SMR/GTEx_V7_cis_eqtl_summary.tar.gz

tar -zxvf GTEx_V7_cis_eqtl_summary.tar.gz

eQTL共定位分析(以westra_eqtl_hg19資料為例):

smr_Linux --bfile file --gwas-summary mygwas.ma --beqtl-summary westra_eqtl_hg19 --out mygwas --thread-num 10

引數解讀:

file為PLINK的二進位制格式檔案,不瞭解的話請見連結https://www.cnblogs.com/chenwenyan/p/6095531.html

mygwas.ma為GWAS的summary檔案,包含SNP、A1、A2、freq、b、se、p、N,N指樣本數(N沒有的話,可以直接賦予NA),內容如下所示:

westra_eqtl_hg19為eQTL資料,該資料通過westra_eqtl_hg19.zip解壓得到

mygwas為生成的共定位結果檔名

eQTL共定位結果(以westra_eqtl_hg19資料為例):

每一列代表的意思:Columns are probe ID, probe chromosome, gene name, probe position, tans-eQTL chromosome, left boundary of the trans-region, right boundary of the trans-region, SNP name, SNP chromosome, SNP position, the effect (coded) allele, the other allele, frequency of the effect allele (estimated from the reference samples), effect size from GWAS, SE from GWAS, p-value from GWAS, effect size from eQTL study, SE from eQTL study, p-value from eQTL study, effect size from SMR, SE from SMR, p-value from SMR, p-value from HEIDI test, and number of SNPs used in the HEIDI test.

3、mQTL共定位分析

下載mQTL資料(注意我這裡下載的是hg19版本的,如果你的GWAS資料不是hg19,請自行更改對應的基因組版本的資料):

資料來源https://cnsgenomics.com/software/smr/#mQTLsummarydata

wget https://cnsgenomics.com/data/SMR/LBC_BSGS_meta.tar.gz

tar -zxvf LBC_BSGS_meta.tar.gz

mQTL共定位分析(以LBC_BSGS_meta的1號染色體資料為例):

smr_Linux --bfile file --gwas-summary mygwas.ma --beqtl-summary /LBC_BSGS_meta/bl_mqtl_chr1 --out mygwas --thread-num 10

引數解讀:

filemygwas.ma與eQTL共定位分析的輸入檔案相同

/LBC_BSGS_meta/bl_mqtl_chr1為mQTL資料,該資料通過LBC_BSGS_meta.tar.gz解壓得到

mygwas為生成的共定位結果檔名

mQTL共定位結果(以LBC_BSGS_meta資料為例):

每一列代表的意思同eQTL的結果分析

4、關於eQTL、mQTL共定位分析相關的文獻推薦


文獻題目:Summary-Based Methylome-Wide Association Analyses Suggest Potential Genetically Driven Epigenetic Heterogeneity of Alzheimer's Disease

不想看英文題目:基於摘要統計的甲基化全基因組分析揭示阿爾茲海默症的表觀異質性

雜誌和影響因子:J Clin Med (IF: 5.688)

分析方法:結合阿爾茲海默症遺傳風險位點和公共資料庫公開的全血、大腦的mQTL位點進行SMR分析,鑑定與阿爾茲海默症和DNA甲基化變化相關的SNP,使用GSA-SNP2包進行通路富集分析。

結論:找到152個探針、113個基因與阿爾茲海默症相關,其中10個基因均在血液和大腦甲基化中達到顯著水平。將個體按照性別、有無高血壓分組,分別找到22和79個顯著探針位點與阿爾茲海默症相關,其可能是阿爾茲海默症異質性的原因。

文章連結:https://pubmed.ncbi.nlm.nih.gov/32429084/


文獻題目: Multivariate genomic scan implicates novel loci and haem metabolism in human ageing

不想看英文題目: 多元基因組掃描揭示人類衰老中新的基因座和血紅素代謝

雜誌和影響因子: Nat Commun (IF: 11.878)

分析方法: 使用MANOVA對壽命、健康壽命、父母壽命三個不同的GWAS summary檔案進行薈萃分析。隨後對感興趣的基因座按照性別和年齡進行分層分析,用GWAS catalog和PhenoScanner查詢感興趣基因的相關表型。使用SMR進行基因表達共定位分析,使用FUMA的Gene2Func進行基因富集分析,使用TwoSampleMR進行孟德爾隨機化隨機化;

結論: 通過薈萃分析,找到了10基因影響三個表型,其中5個(FOXO3,SLC4A7,LINC02513,ZW10和FGD6)是以前未報道過的。這10個基因座大多數與心血管疾病有關,其表達活性隨年齡發生變化。有78個基因富集在衰老通路上,涉及的通路有DNA損傷,凋亡和體內平衡,血紅素代謝。

文章連結:

https://pubmed.ncbi.nlm.nih.gov/32678081/