單細胞分析實錄(16): 非負矩陣分解(NMF)檢測細胞異質性
相信做過腫瘤單細胞的小夥伴對這個分析並不陌生,如果多讀幾篇文獻,就能在CNS以及大子刊上面看到這個分析。
非負矩陣分解(Nonnegative Matrix Factorization,NMF)是在矩陣中所有元素均為非負數約束條件之下的矩陣分解方法。
基本思想:給定一個非負矩陣V, NMF能夠找到一個非負矩陣W和一個非負矩陣H, 使得矩陣W和H的乘積近似等於矩陣V中的值。
放在我們單細胞轉錄組的場景下,就是需要將一個基因×細胞
的表達矩陣(V),分解成基因×表達程式
(W),與表達程式×細胞
(H)兩個矩陣的乘積。如下圖:
在基因×表達程式
矩陣中,存放的是每個program中,每個基因的權重,往往根據權重最大的前20/30個基因來確定該program的功能
基因×表達程式
矩陣,還可以畫相關性熱圖,也就是文獻中經常出現的那個圖。在
表達程式×細胞
矩陣中,存放的是每個細胞中,每個program的相對強弱/使用情況。
接下來的內容分為兩篇,本篇推文介紹一些文章中用NMF解析腫瘤細胞異質性的例子,下一篇手把手演示一遍NMF分析及作圖(將在公眾號釋出)。
1. 頭頸鱗癌
Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumor Ecosystems in Head and Neck Cancer
這一篇文獻發表於2017年,算是很早期的單細胞文章了,文章利用NMF得到了一個p-EMT表達程式,其可以作為淋巴結轉移、分級、病理特徵的獨立預測因子。
上圖的B就是所有program的相關性聚類熱圖,一般會將功能相似且相關性高的多個program當做一個meta program。A圖是某一個病人,program對應的基因的表達情況。
2. 鼻咽癌
Single-cell transcriptomic analysis defines the interplay between tumor cells, virus infection, and the microenvironment in nasopharyngeal carcinoma。
這一篇文章去年發表於Cell Research,對鼻咽癌腫瘤微環境進行了解析,同時用NMF在腫瘤細胞中鑑別出一個表示“免疫原性”的表達程式,進而找出一類獨特的“上皮-免疫”雙重特徵腫瘤細胞亞群。
上面兩篇文獻的主要發現和結論都是基於NMF的結果,可見NMF在解析腫瘤細胞異質性領域的作用之大。當然,NMF也能用於其他細胞型別的單細胞資料。
3. 新冠研究
Plasma from patients with bacterial sepsis or severe COVID-19 induces suppressive myeloid cell production from hematopoietic progenitors in vitro
研究者用NMF在單核細胞中鑑定出一種MS1表達程式,MS1 表達程式與細菌性敗血症和 COVID-19 的疾病嚴重程度相關,高表達意味著疾病更嚴重。
因水平有限,有錯誤的地方,歡迎批評指正!