1. 程式人生 > 其它 >單細胞分析實錄(16): 非負矩陣分解(NMF)檢測細胞異質性

單細胞分析實錄(16): 非負矩陣分解(NMF)檢測細胞異質性

相信做過腫瘤單細胞的小夥伴對這個分析並不陌生,如果多讀幾篇文獻,就能在CNS以及大子刊上面看到這個分析。

非負矩陣分解(Nonnegative Matrix Factorization,NMF)是在矩陣中所有元素均為非負數約束條件之下的矩陣分解方法。
基本思想:給定一個非負矩陣V, NMF能夠找到一個非負矩陣W和一個非負矩陣H, 使得矩陣W和H的乘積近似等於矩陣V中的值。

放在我們單細胞轉錄組的場景下,就是需要將一個基因×細胞的表達矩陣(V),分解成基因×表達程式(W),與表達程式×細胞(H)兩個矩陣的乘積。如下圖:

基因×表達程式矩陣中,存放的是每個program中,每個基因的權重,往往根據權重最大的前20/30個基因來確定該program的功能

。如果是多個樣本,每一個樣本均進行以上操作,整合所有樣本的基因×表達程式矩陣,還可以畫相關性熱圖,也就是文獻中經常出現的那個圖。
表達程式×細胞矩陣中,存放的是每個細胞中,每個program的相對強弱/使用情況。

接下來的內容分為兩篇,本篇推文介紹一些文章中用NMF解析腫瘤細胞異質性的例子,下一篇手把手演示一遍NMF分析及作圖(將在公眾號釋出)。

1. 頭頸鱗癌

Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumor Ecosystems in Head and Neck Cancer

這一篇文獻發表於2017年,算是很早期的單細胞文章了,文章利用NMF得到了一個p-EMT表達程式,其可以作為淋巴結轉移、分級、病理特徵的獨立預測因子。

上圖的B就是所有program的相關性聚類熱圖,一般會將功能相似且相關性高的多個program當做一個meta program。A圖是某一個病人,program對應的基因的表達情況。

2. 鼻咽癌

Single-cell transcriptomic analysis defines the interplay between tumor cells, virus infection, and the microenvironment in nasopharyngeal carcinoma。
這一篇文章去年發表於Cell Research,對鼻咽癌腫瘤微環境進行了解析,同時用NMF在腫瘤細胞中鑑別出一個表示“免疫原性”的表達程式,進而找出一類獨特的“上皮-免疫”雙重特徵腫瘤細胞亞群。

上面兩篇文獻的主要發現和結論都是基於NMF的結果,可見NMF在解析腫瘤細胞異質性領域的作用之大。當然,NMF也能用於其他細胞型別的單細胞資料。

3. 新冠研究

Plasma from patients with bacterial sepsis or severe COVID-19 induces suppressive myeloid cell production from hematopoietic progenitors in vitro

研究者用NMF在單核細胞中鑑定出一種MS1表達程式,MS1 表達程式與細菌性敗血症和 COVID-19 的疾病嚴重程度相關,高表達意味著疾病更嚴重。

因水平有限,有錯誤的地方,歡迎批評指正!