1. 程式人生 > >基因表達模式聚類以及視覺化

基因表達模式聚類以及視覺化

最近在使用RNA_seq資料做些分析,結果得到了大量差異表達以及共表達的基因,如何合理展示這些基因也是一件不簡單的事情。除了常見的熱圖(heatmap)展現形式,今天在推薦另外一種展示方式(下圖C)。

這裡寫圖片描述

需要R包TCseq或者Mfuzz。我這裡給出的程式碼是基於TCseq。
輸入檔案就是一個基因表達量的矩陣,如下圖。
這裡寫圖片描述

程式碼也很簡單,見下圖,也請點選閱讀原文檢視程式碼。

library(TCseq)
svg(filename="/stress_analysis/drought_and_heat/heat.svg",width=3.5,height=15)
data <- read.csv
("/stress_analysis/drought_and_heat/heat.txt",row.names="Name",sep="\t") data <- as.matrix(data) tca <- timeclust(data, algo = "cm", k = 6, standardize = TRUE) p <- timeclustplot(tca, categories="time(h)", cols = 1, axis.text.size=12,legend.text.size=10, legend.title.size=10,title.size=12,axis.title
.size=12) cluster1 <- clustCluster(tca) #輸出基因的聚類資訊 out_file <- paste("//stress_analysis/drought_and_heat/heat_cluster.txt",sep ="") write.csv(cluster1,out_file) dev.off()

結果如下圖,該圖經過後期編輯,與熱圖進行了合併。

這裡寫圖片描述