1. 程式人生 > >基因富集分析

基因富集分析

https://www.jianshu.com/p/a1f312b60569

http://www.360doc.com/content/16/0711/10/26456292_574656968.shtml

diff_gene.entrez檔案,是通過各種差異基因軟體找出來的差異基因的entrez ID號列表,每一個ID號一行,幾百個差異基因就幾百行

http://blog.sciencenet.cn/blog-1509670-971259.html

上述表格為差異基因的KEGG Pathway富集分析結果表格。

ID: KEGG 資料庫中通路唯一的編號資訊。

Description :Gene Ontology功能的描述資訊

GeneRatio:差異基因中與該Term相關的基因數與整個差異基因總數的比值

BgRation:所有( bg)基因中與該ID相關的基因數與所有( bg)基因的比值

pvalue: 富集分析統計學顯著水平,一般情況下, P-value < 0.05 該功能為富集項

p.adjust 矯正後的P-Value

qvalue:對p值進行統計學檢驗的q值

Count:差異基因中與該Term相關的基因數

setwd("C:\\Users\\Administrator\\Desktop\\ref")

a=read.table("diff_gene.entrez")

require(DOSE)

require(clusterProfiler)

gene=as.character(a[,1])

ego <- enrichGO(gene=gene,organism="human",ont="CC",pvalueCutoff=0.01,readable=TRUE)

ekk <- enrichKEGG(gene=gene,organism="human",pvalueCutoff=0.01,readable=TRUE)

write.csv(summary(ekk),"KEGG-enrich.csv",row.names =F)

write.csv(summary(ego),"GO-enrich.csv",row.names =F)