單細胞分析實錄(19): 基於CellPhoneDB的細胞通訊分析及視覺化 (下篇)

阿新 • • 發佈：2021-07-25

在上一篇帖子中，我介紹了CellPhoneDB的原理、實際操作，以及一些值得注意的地方。這一篇繼續細胞通訊分析的視覺化。

公眾號後臺回覆20210723獲取本次演示的測試資料，以及主要的視覺化程式碼。

所有的資料和結果檔案均已打包，下載後直接就能跑下面的程式碼畫圖。

下面的程式碼可以繪製對稱熱圖

（如果你不清楚為啥熱圖要沿著對角線對稱，可以看一下之前的推文）

library(tidyverse)
library(RColorBrewer)
library(scales)

pvalues=read.table("./test/pvalues.txt",header = T,sep = "\t",stringsAsFactors = F)
pvalues=pvalues[,12:dim(pvalues)[2]]
statdf=as.data.frame(colSums(pvalues < 0.05))
colnames(statdf)=c("number")

statdf$indexb=str_replace(rownames(statdf),"^.*\\.","")
statdf$indexa=str_replace(rownames(statdf),"\\..*$","")
statdf$total_number=0

for (i in 1:dim(statdf)[1]) {
  tmp_indexb=statdf[i,"indexb"]
  tmp_indexa=statdf[i,"indexa"]
  if (tmp_indexa == tmp_indexb) {
    statdf[i,"total_number"] = statdf[i,"number"]
  } else {
    statdf[i,"total_number"] = statdf[statdf$indexb==tmp_indexb & statdf$indexa==tmp_indexa,"number"]+
      statdf[statdf$indexa==tmp_indexb & statdf$indexb==tmp_indexa,"number"]
  }
}

rankname=sort(unique(statdf$indexa)) 
statdf$indexa=factor(statdf$indexa,levels = rankname)
statdf$indexb=factor(statdf$indexb,levels = rankname)

statdf%>%ggplot(aes(x=indexa,y=indexb,fill=total_number))+geom_tile(color="white")+
  scale_fill_gradientn(colours = c("#4393C3","#ffdbba","#B2182B"),limits=c(0,20))+
  scale_x_discrete("cluster 1")+
  scale_y_discrete("cluster 2")+
  theme_minimal()+
  theme(
    axis.text.x.bottom = element_text(hjust = 1, vjust = NULL, angle = 45),
    panel.grid = element_blank()
  )
ggsave(filename = "interaction.num.2.pdf",device = "pdf",width = 12,height = 10,units = c("cm"))

還可以用網路圖表示互作關係的數量

程式碼如下

library(tidyverse)
library(RColorBrewer)
library(scales)
library(igraph)

pvalues=read.table("./test/pvalues.txt",header = T,sep = "\t",stringsAsFactors = F)
pvalues=pvalues[,12:dim(pvalues)[2]]
statdf=as.data.frame(colSums(pvalues < 0.05))
colnames(statdf)=c("number")

statdf$indexb=str_replace(rownames(statdf),"^.*\\.","")
statdf$indexa=str_replace(rownames(statdf),"\\..*$","")
rankname=sort(unique(statdf$indexa)) 

A=c()
B=c()
C=c()
remaining=rankname
for (i in rankname[-6]) {
  remaining=setdiff(remaining,i)
  for (j in remaining) {
    count=statdf[statdf$indexa == i & statdf$indexb == j,"number"]+
      statdf[statdf$indexb == i & statdf$indexa == j,"number"]
    A=append(A,i)
    B=append(B,j)
    C=append(C,count)
  }
}

statdf2=data.frame(indexa=A,indexb=B,number=C)
statdf2=statdf2 %>% rbind(statdf[statdf$indexa==statdf$indexb,c("indexa","indexb","number")])
statdf2=statdf2[statdf2$number > 0,] #過濾掉值為0的觀測

#設定節點和連線的顏色
color1=c("#8DD3C7", "#FDB462", "#B3DE69", "#FCCDE5", "#D9D9D9", "#BC80BD")
names(color1)=rankname
color2=colorRampPalette(brewer.pal(9, "Reds")[3:7])(20) #將顏色分成多少份，取決於互作關係數目的最大值
names(color2)=1:20 #每一份顏色用對應的數字命名

#做網路圖
##下面的四行程式碼相對固定
net <- graph_from_data_frame(statdf2[,c("indexa","indexb","number")])
edge.start <- igraph::ends(net, es=igraph::E(net), names=FALSE)
group <-  cluster_optimal(net)
coords <- layout_in_circle(net, order = order(membership(group)))

E(net)$width <- E(net)$number / 2 #將數值對映到連線的寬度，有時還需要微調，這裡除以2就是這個目的
E(net)$color <- color2[as.character(ifelse(E(net)$number > 20,20,E(net)$number))] #用前面設定好的顏色賦給連線，顏色深淺對應數值大小
E(net)$label = E(net)$number #連線的標註
E(net)$label.color <- "black" #連線標註的顏色
V(net)$label.color <- "black" #節點標註的顏色
V(net)$color <- color1[names(V(net))] #節點的填充顏色，前面已經設定了；V(net)返回節點資訊

#調整節點位置的線條角度
##如果沒有這兩行程式碼，節點位置的圓圈是向右的
loop.angle<-ifelse(coords[igraph::V(net),1]>0,-atan(coords[igraph::V(net),2]/coords[igraph::V(net),1]),pi-atan(coords[igraph::V(net),2]/coords[igraph::V(net),1]))
igraph::E(net)$loop.angle[which(edge.start[,2]==edge.start[,1])] <- loop.angle[edge.start[which(edge.start[,2]==edge.start[,1]),1]]

#pdf("interaction.num.3.pdf",width = 6,height = 6)
plot(net,
     edge.arrow.size = 0, #連線不帶箭頭
     edge.curved = 0, #連線不彎曲
     vertex.frame.color = "black", #節點外框顏色
     layout = coords,
     vertex.label.cex = 1, #節點標註字型大小
     vertex.size = 30) #節點大小
#dev.off()

氣泡圖——具體的互作關係

以上幾種圖，只是用來展示數量，具體的兩種細胞之間的互作關係可以用如下的程式碼展示：

source("CCC.bubble.R")
CCC(
  pfile="./test/pvalues.txt",
  mfile="./test/means.txt",
  #neg_log10_th= -log10(0.05),
  #means_exp_log2_th=1,
  #neg_log10_th2=3,
  #means_exp_log2_th2=c(-4,6),
  #notused.cell=c("Bcell","Gcell"),
  #used.cell=c("Mcell"),
  #cell.pair=c("Mcell.Scell","Mcell.NKcell","Mcell.Tcell","Scell.Mcell","NKcell.Mcell","Tcell.Mcell"),#這裡是自定義的順序，若是可選細胞對的子集，則只展示子集，若有交集則只展示交集；空值情況下，會根據可選細胞對自動排序
  #gene.pair=c("MIF_TNFRSF14","FN1_aVb1 complex","EGFR_MIF")#作用同上
)
ggsave(filename = "interaction.detail.1.pdf",device = "pdf",width =20,height = 12,units = "cm")

引數解釋：

neg_log10_th和means_exp_log2_th兩個引數用來篩選顯著的互作關係；
neg_log10_th2和means_exp_log2_th2兩個引數用來限定最終氣泡圖的數值範圍；
notused.cell不包含的細胞型別；
used.cell必須包含的細胞型別；
cell.pair必須包含的細胞pair，以及它們的順序；
gene.pair必須包含的基因pair，以及它們的順序。

後面四個引數在細化氣泡圖的時候，很有用。

我們先不加額外的引數，檢視全部的互作關係

隨後再細化，指定需要展示的細胞型別和gene pair，如下：

CCC(
  pfile="./test/pvalues.txt",
  mfile="./test/means.txt",
  cell.pair=c("Mcell.Scell","Mcell.NKcell","Mcell.Tcell","Scell.Mcell","NKcell.Mcell","Tcell.Mcell"),#這裡是自定義的順序，若是可選細胞對的子集，則只展示子集，若有交集則只展示交集；空值情況下，會根據可選細胞對自動排序
  gene.pair=c("MIF_TNFRSF14","FN1_aVb1 complex","EGFR_MIF")#作用同上
)
ggsave(filename = "interaction.detail.2.pdf",device = "pdf",width =16,height = 10,units = "cm")

最後那個CCC( )函式是小編寫的，小編覺得還挺好用的。並不複雜，也才120行。如果你也想用，歡迎轉發上一篇推文，截圖後發給公眾號後臺，留下郵箱，小編就會發給你哦。別怪小編套路呀，寫這兩篇帖子花了不少時間呢
因水平有限，有錯誤的地方，歡迎批評指正！

單細胞分析實錄(19): 基於CellPhoneDB的細胞通訊分析及視覺化 (下篇)

在上一篇帖子中，我介紹了CellPhoneDB的原理、實際操作，以及一些值得注意的地方。這一篇繼續細胞通訊分析的視覺化。

python 微信好友特徵資料分析及視覺化

一、背景及研究現狀在我國網際網路的發展過程中，PC網際網路已日趨飽和，移動網際網路卻呈現井噴式發展。資料顯示，截止2013年底，中國手機網民超過5億，佔比達81%。伴隨著移動終端價格的下降及wifi的廣泛鋪設，移動

基於Web Audio API實現音訊視覺化效果

網頁音訊介面最有趣的特性之一它就是可以獲取頻率、波形和其它來自聲源的資料，這些資料可以被用作音訊視覺化。這篇文章將解釋如何做到視覺化，並提供了一些基礎使用案例。

基於webGL三維停車場，視覺化管理Demo

前言隨著社會的發展，城市中的汽車越來越多。車輛集中存放管理的場所被人類提出車輛進出的秩序、車輛存放的安全性、車輛存放管理的有償性等要求。停車場系統應用現代機械電子及通訊科學技術，集控制硬體、軟體於一體

Python專案@基於Flask的大屏資料視覺化

最後完成的效果爬取資料 get_tencent_data() def get_tencent_data(): \"\"\" :return: list全國彙總資料/日期為主鍵每日更新 list當日詳細資料

基於python中networkx包的傳教士和野人深度優先搜尋演算法及視覺化實現

按《人工智慧原理》書上的思路進行建模。只是記錄一下自己的作業，感覺之前好多用心寫的程式碼沒利用起來，發在部落格整理一下，不喜勿噴。

單細胞分析實錄(7): 差異表達分析/細胞型別註釋

前面已經講解了：單細胞分析實錄(1): 認識Cell Hashing 單細胞分析實錄(2): 使用Cell Ranger得到表達矩陣

單細胞分析實錄(16): 非負矩陣分解(NMF)檢測細胞異質性

相信做過腫瘤單細胞的小夥伴對這個分析並不陌生，如果多讀幾篇文獻，就能在CNS以及大子刊上面看到這個分析。

單細胞分析實錄(2): 使用Cell Ranger得到表達矩陣

Cell Ranger是一個“傻瓜”軟體，你只需提供原始的fastq檔案，它就會返回feature-barcode表達矩陣。為啥不說是gene-cell，舉個例子，cell hashing資料得到的矩陣還有tag行，而列也不能肯定就是一個cell，可能考慮到這

單細胞分析實錄(3): Cell Hashing資料拆分

在之前的文章裡，我主要講了如下兩個內容：(1) 認識Cell Hashing；(2): 使用Cell Ranger得到表達矩陣。相信大家已經知道了cell hashing與普通10X轉錄組的差異，以及使用cellranger得到表達矩陣。

單細胞分析實錄(4): doublet檢測

最近Cell Systems雜誌發表了一篇針對現有幾種檢測單細胞測序doublet的工具的評估文章，系統比較了常見的例如Scrublet、DoubletFinder等工具在檢測準確性、計算效率等方面的優劣，以及比較了使用不同方法去除doublet後

【程式碼更新】單細胞分析實錄(20): 將多個樣本的CNV定位到染色體臂，並畫熱圖

之前寫過三篇和CNV相關的帖子，如果你做腫瘤單細胞轉錄組，大概率看過：單細胞分析實錄(11): inferCNV的基本用法

Java 中基於各種資料型別分析 == 和 equals 的區別

前言分析一、int 和 Integer1、Integer 物件使用 new 關鍵字生成2、表面上不是 new 關鍵字生成的 Integer 物件3、兩個 int 變數比較4、new 生成的 Integer 物件和 int 變數比較5、非 new 生成的 Integer 物件和 int

基於ROS 服務通訊模式詳解

ROS 服務通訊模式摘自《ROS機器人開發實踐》服務（services）是節點之間通訊的另一種方式。服務允許節點發送請求（request）並獲得一個響應（response）

python基於socket實現的UDP及TCP通訊功能示例

本文例項講述了python基於socket實現的UDP及TCP通訊功能。分享給大家供大家參考，具體如下：

基於Tensorflow:CPU效能分析

iostat iostat用於輸出CPU和磁碟I/O相關的統計資訊. 命令格式: 1）顯示所有裝置負載情況

基於Pytorch SSD模型分析

本文參考github上SSD實現,對模型進行分析,主要分析模型組成及輸入輸出大小.SSD網路結構如下圖:

基於Python詞雲分析政府工作報告關鍵詞

前言十三屆全國人大三次會議作了政府工作報告。這份政府工作報告僅有10500字左右，據悉是改革開放40年以來最短的一次。受到疫情影響，今年的兩會會議適當縮短，政府工作報告也大幅壓縮，體現了“實幹為要”的理念。

c++和Java用Base64編碼中文通訊分析

背景在某寶上看到一個藥品管理系統，他有一個雲藥品庫。用掃碼槍一掃，就可用獲取到藥品的詳細資訊。可以在添加藥品基礎資料的時候，免去輸入文字的麻煩，而我在上家公司的時候，也是做藥品ERP的，客戶拿著我們的ER

基於Spark2.x新聞網大資料實時分析視覺化系統專案實戰

本次專案是基於企業大資料經典案例專案（大資料日誌分析），全方位、全流程講解大資料專案的業務分析、技術選型、架構設計、叢集規劃、安裝部署、整合繼承與開發和web視覺化互動設計。

單細胞分析實錄(19): 基於CellPhoneDB的細胞通訊分析及視覺化 (下篇)

下面的程式碼可以繪製對稱熱圖

還可以用網路圖表示互作關係的數量

氣泡圖——具體的互作關係

相關推薦