1. 程式人生 > 實用技巧 >SC2disease:人類疾病的單細胞轉錄組的人工收集資料庫

SC2disease:人類疾病的單細胞轉錄組的人工收集資料庫

SC2disease:人類疾病的單細胞轉錄組的人工收集資料庫

近日,國際權威學術期刊《核酸研究》(Nucleic Acids Research)發表了西北工業大學、西安交通大學、哈爾濱工業大學、復旦大學、天津大學等團隊合作開發的首個包含細胞型別特異資訊的疾病基因資料庫,旨在提供病病例與健康對照之間、病例中不同細胞型別之間以及不同病理程度病例之間基因表達的差異。
在這裡插入圖片描述

單細胞RNA測序(scRNA-seq)技術能夠以單個細胞解析度研究複雜生物的轉錄組,為科學家提供了一種新的工具來研究細胞在表達模式上的異質性,特別是疾病細胞的異質性。另一方面,scRNA-seq的快速發展為探索疾病微環境中的細胞亞群提供了新的思路,有利於研究疾病的發生、發展、耐藥性(2)和免疫逃逸。

scRNA-seq技術已被廣泛應用於病例對照研究中差異表達基因的識別以及細胞亞群之間差異的識別。許多研究人員利用scRNA-seq鑑定了疾病中基因表達的特異性,例如識別阿爾茨海默病(老年痴呆)中多個神經元細胞亞群的差異表達基因,識別慢性髓性白血病不同階段癌症幹細胞亞群的分子特徵,揭示2型糖尿病患者中細胞型別特異性基因表達的變化,等。

隨著scRNA-seq在轉錄組分析中的廣泛應用,已經建立了多個scRNA-seq相關資料庫。儘管這些資料庫為在單細胞水平上研究不同細胞型別和組織中的基因表達提供了便利,但不同疾病中基因表達特異性的資料庫仍屬空白。

西北工業大學、西安交通大學與哈爾濱工業大學等團隊合作,開發了SC2disease資料庫,旨在提供病病例與健康對照之間、病例中不同細胞型別之間以及不同病理程度病例之間基因表達的差異。SC2disease資料庫提供了一個使用者友好的介面,用於瀏覽各種感興趣基因的表達,搜尋細胞型別marker,以探索多種疾病的生物標誌物,比較疾病和非疾病狀態下各種細胞型別的表達譜。總的來說,SC2disease (http://easybioai.com/sc2disease/),是使用者探索不同細胞型別、組織和疾病中細胞型別特異性基因的綜合資源。

細胞型別特異基因及其在人類疾病中的表達是從出版物中手工提取的。這些出版物是在PubMed中搜索諸如‘single cell sequencing’, ‘single cell sequencing disease’, and ‘10x genomics”等關鍵詞獲得的。隨後,對其相應的人類疾病、實驗組織、細胞型別、顯著基因及其表達進行了提取和複驗。資料收集過程如下所示。

在這裡插入圖片描述

圖1.資料收集過程

我們選擇了使用高質量scRNA-seq平臺研究人類疾病的文獻。 這些文獻的原始作者已經開發了用於分析其原始資料的特定pipeline,因此我們將其細胞型別特異性基因的結果手動提取到SC2disease中。 此外,為了提高不同研究之間的可比性,我們設計了統一的pipeline重新分析每個研究的基因表達矩陣。 我們還將這些重新分析的結果也放入SC2disease中。

在當前版本的SC2disease中收集了341種細胞型別和29種組織中與25種疾病有關的基因表達。 這些疾病及其實驗組織和細胞型別如圖2所示。

在這裡插入圖片描述

圖2. SC2disease收集了25種人類疾病的細胞型別特異性基因。從29個組織中提取細胞,共計341種細胞型別

SC2disease中總共記錄了946,481個條目。 每個條目包含10個部分,用於描述基因與相關疾病之間的關係。 這10個部分包括疾病名稱,實驗組織,細胞型別,基因名稱,用於描述基因表達的變數名稱(log2FC或均值),變數的值,差異表達基因(DEG)的比較,PMID,測序平臺和詳細資訊。 “詳細資訊”部分包含有關細胞型別,疾病和基因的詳細資訊。

綜上,SC2disease的開發為研究基於scRNA-seq的人類疾病相關細胞型別特異性基因提供了重要支撐。

Cite: SC2diseases: a manually curated database of Single-Cell Transcriptome for human diseases, Nucleic Acids Research, 2020