基因富集分析
https://www.jianshu.com/p/a1f312b60569
http://www.360doc.com/content/16/0711/10/26456292_574656968.shtml
diff_gene.entrez檔案,是通過各種差異基因軟體找出來的差異基因的entrez ID號列表,每一個ID號一行,幾百個差異基因就幾百行
http://blog.sciencenet.cn/blog-1509670-971259.html
上述表格為差異基因的KEGG Pathway富集分析結果表格。
ID: KEGG 資料庫中通路唯一的編號資訊。
Description :Gene Ontology功能的描述資訊
GeneRatio:差異基因中與該Term相關的基因數與整個差異基因總數的比值
BgRation:所有( bg)基因中與該ID相關的基因數與所有( bg)基因的比值
pvalue: 富集分析統計學顯著水平,一般情況下, P-value < 0.05 該功能為富集項
p.adjust 矯正後的P-Value
qvalue:對p值進行統計學檢驗的q值
Count:差異基因中與該Term相關的基因數
setwd("C:\\Users\\Administrator\\Desktop\\ref")
a=read.table("diff_gene.entrez")
require(DOSE)
require(clusterProfiler)
gene=as.character(a[,1])
ego <- enrichGO(gene=gene,organism="human",ont="CC",pvalueCutoff=0.01,readable=TRUE)
ekk <- enrichKEGG(gene=gene,organism="human",pvalueCutoff=0.01,readable=TRUE)
write.csv(summary(ekk),"KEGG-enrich.csv",row.names =F)
write.csv(summary(ego),"GO-enrich.csv",row.names =F)