基因表達模式聚類以及視覺化
阿新 • • 發佈:2019-02-11
最近在使用RNA_seq資料做些分析,結果得到了大量差異表達以及共表達的基因,如何合理展示這些基因也是一件不簡單的事情。除了常見的熱圖(heatmap)展現形式,今天在推薦另外一種展示方式(下圖C)。
需要R包TCseq或者Mfuzz。我這裡給出的程式碼是基於TCseq。
輸入檔案就是一個基因表達量的矩陣,如下圖。
程式碼也很簡單,見下圖,也請點選閱讀原文檢視程式碼。
library(TCseq)
svg(filename="/stress_analysis/drought_and_heat/heat.svg",width=3.5,height=15)
data <- read.csv ("/stress_analysis/drought_and_heat/heat.txt",row.names="Name",sep="\t")
data <- as.matrix(data)
tca <- timeclust(data, algo = "cm", k = 6, standardize = TRUE)
p <- timeclustplot(tca, categories="time(h)", cols = 1, axis.text.size=12,legend.text.size=10, legend.title.size=10,title.size=12,axis.title .size=12)
cluster1 <- clustCluster(tca) #輸出基因的聚類資訊
out_file <- paste("//stress_analysis/drought_and_heat/heat_cluster.txt",sep ="")
write.csv(cluster1,out_file)
dev.off()
結果如下圖,該圖經過後期編輯,與熱圖進行了合併。