單細胞RNA測序(scRNA-seq)技術可以在單細胞水平下研究復雜的多細胞生物的轉錄組譜。這為科學家提供了一種研究表達模式中細胞異質性的新工具,尤其是疾病細胞的異質性。更重要的是,scRNA-seq的快速發展帶來了在疾病微環境中探索細胞亞群的見識,這有助于研究疾病的發生,發展,耐藥性和免疫逃逸。scRNA-seq技術已被廣泛應用于病例對照研究中差異表達基因的識別以及細胞亞群之間差異的識別。
今天我們來講一篇刊登在Nucleic Acids Research期刊(IF=11.502),題名為SC2disease: a manually curated database of single-cell transcriptome for human diseases的文章。SC2disease是一個人工收集的數據庫,能為研究者提供各種疾病的各種細胞類型準確的基因表達譜資源。該網站通過回顧2020年3月之前使用scRNA-seq研究人類樣本疾病的文獻,并開發了SC2disease數據庫,通過疾病、組織和細胞類型整理數據。SC2disease包含946481條數據,對應341種細胞類型、29種組織和25種疾病。SC2disease數據庫中的每個條目都包含不同細胞類型、組織和疾病相關健康狀況之間差異表達基因的比較。
SC2disease提供瀏覽器和搜索引擎,以查詢有關不同疾病中特定于細胞類型的基因的詳細信息,具體流程如圖。
“疾病”和“單元格類型”是SC2disease瀏覽器的根類別?!凹膊 备悇e中總共包括25種疾病,通過單擊疾病名稱可以顯示與所關注疾病相關的特定于細胞類型的基因的詳細信息。最初將所有細胞類型分為16組,以幫助想要瀏覽特定細胞類型中標記基因的研究人員。還可以使用“搜索”功能搜索他們感興趣的疾病,基因或細胞類型。每個基因的信息將在表格中以一行顯示,其中包括疾病名稱,實驗組織,細胞類型,基因名稱,用于描述基因表達的變量名稱(log 2 FC或均值),變量的值,DEG比較,源發布的標識符,排序平臺和詳細信息。點擊該基因的名稱,將彈出該基因在NCBI中的鏈接。也可以單擊“paper ID”來瀏覽原始文獻中的更多詳細信息。最后,在“詳細信息”部分中總結了有關疾病,細胞類型和基因的詳細信息。
SC2disease還提供了從基于單細胞的結果和基于GWAS的結果得出的疾病的易感基因。所有GWAS數據均從GWAS目錄獲得。以2型糖尿病為例,將通過單擊“可視化”顯示由scRNA-seq和GWAS檢測到的易感基因列表。此外,可通過單擊“可視化”以可視方式顯示結果。在所得圖中,x軸是從GWAS結果獲得的基因中SNP的最小P值。y軸是從scRNA-seq結果獲得的疾病的重疊敏感性基因的細胞類型。條的顏色顯示基因表達的log 2倍變化。