長鏈非編碼RNA (lncRNAs)最近被認為與結直腸癌(CRC)的免疫修飾有關。然而,與免疫相關的lncRNAs的臨床意義在很大程度上仍未被探索。目前,有研究構建一個免疫來源的lncRNA signature(IRLS)來改善個體結直腸癌患者的臨床結果,該研究于2022年12月發表在《Nature communications》,IF:17.694。
技術路線:
主要研究結果:
1. 免疫浸潤共識簇的開發和驗證
該研究的總體設計如圖1所示。根據單樣本基因集富集分析(ssGSEA)評估的28個免疫細胞浸潤,進行了共識聚類分析,其中所有CRC樣本最初被分為k (k = 2.9)個聚類。一致性得分矩陣和模糊聚類(PAC)統計量的累積分布函數(CDF)曲線表明,當k = 2時,得到最優數量(圖1A、B)。兩個共識簇(C1和C2)顯示了免疫浸潤的顯著差異,C2的總體浸潤度明顯高于C1(圖1C、D)。因此,將C1定義為免疫冷腫瘤,C2定義為免疫熱腫瘤。為了確保分析算法不影響兩個共識聚類,使用TIMER、quanTIseq、MCP-counter、xCell、EPIC和ESTIMATE等6種算法來驗證ssGSEA結果的穩定性和穩定性(圖1E)。
圖1兩種算法識別免疫相關lncRNA
2. 鑒定來自免疫浸潤模式的lncRNA模塊
加權相關網絡分析(WGCNA)過程中,將軟閾值β設為9(no scale R2 R2 = 0.910),然后,12個模塊被識別,以不同的顏色表示。在模塊-性狀關系中,黃色模塊與免疫簇之間的相關性最高(圖1F)。在黃色模塊中,基因顯著性(GS)與模塊隸屬度(MM)的相關系數達到0.96,說明lncRNA模塊構建質量較優(圖1G)。為了鑒定來自黃色模塊內免疫浸潤模式的hub lncRNA, 526個lncRNAs GS > 0.5和MM > 0.6被認為是hub免疫相關lncRNA (圖1 G)。
3. 免疫相關lncRNA產生于ImmLnc途徑
ImmLnc系統地從lncRNA和基因表達譜中推斷出免疫相關通路活性的候選lncRNA調控因子。一種假設是,如果一個特定的lncRNA在免疫調節中發揮關鍵作用,那么其相關基因應該富集在免疫相關通路的頂部或底部。通過ImmLnc管道,鑒定出了791個與免疫相關的lncRNA (補充數據1)。大量的lncRNA與細胞因子受體、TCR信號通路、趨化因子受體、自然殺傷細胞的細胞毒性以及抗原加工遞呈通路相關(圖1H)。將WGCNA結果進行交集,共提取出235個重疊lncRNA進行后續分析(圖1I)。
4.綜合構建一種共識特征
基于235個免疫相關lncRNA的表達譜,單因素Cox分析鑒定出43個預后相關lncRNA。對這43個lncRNA進行了基于機器學習的整合程序,以形成一致的免疫相關lncRNA特征(IRLS)。在TCGA-CRC數據集中,通過LOOCV框架擬合了101種預測模型,并進一步計算了所有驗證數據集中每個模型的C-index(圖2A)。最優模型是Lasso和stepwise Cox (direction = both)的組合,平均c指數最高(0.696),該組合模型在所有驗證數據集中c指數領先(圖2A)。在Lasso回歸中,當基于LOOCV框架的偏似然偏差達到最小值時獲得最佳λ(圖2B)。對Lasso系數不為零的30個lncRNA進行了stepwise Cox比例風險回歸,最終確定了16個lncRNA (圖2C)。
接下來,通過Cox模型中16個lncRNA的回歸系數加權,計算每個患者的風險評分(圖2C)。所有患者根據調查包確定的最佳臨界值被分為高危組和低危組。如圖2D-J所示,在TCGA-CRC訓練數據集和6個驗證數據集中,相對于低風險組,高危組患者的總生存期(OS)明顯較低(均P < 0.05)。合并所有樣本的元隊列也顯示出同樣的趨勢(P < 0.05)(圖2K)。
圖2通過基于機器學習的集成程序開發并驗證了一個共識IRLS
5. IRLS模型的評估
ROC分析測定了IRLS的鑒別度 (圖3A,B)。比較IRLS與其他臨床和分子變量在預測預后方面的表現。如圖3C所示,IRLS的準確性明顯優于年齡等其他變量:性別、T、N、M、TMB;NAL;microsatellite state;ACT;TP53、KRAS或BRAF突變(P < 0.05,除GSE29621中IRLS與AJCC期比較外)。這些結果推測出IRLS和AJCC分期的結合可能會進一步提高該模型的預測能力。
圖3 IRLS模型的評估
6. 基于基因表達的CRC預后標志的比較
為了比較IRLS與其他預后特征的性能,作者全面檢索了已發布的預后特征。由于GPL570注釋的驗證數據集中嚴重缺乏miRNA信息,miRNA簽名被排除。最終,納入了109個signatures (包括mRNA和lncRNA signatures)。這些signatures與各種生物學過程相關,如免疫應答、自噬、ferroptosis、干性、上皮間充質轉化、toll樣受體信號轉導、缺氧、糖酵解、脂肪生成、維生素D、表觀遺傳學、n6 -甲基腺苷、衰老、WNT和藥物敏感性。在所有數據集上對每個signatures進行單變量Cox回歸,觀察到在所有隊列中只有作者的模型與預后顯著相關(圖4A),這證明了IRLS的穩定性。此外,將IRLS的c指數與其他signature進行比較:IRLS在每個數據集上的表現都優于幾乎所有模型(圖4B)。大多數模型在自己的訓練數據集和少數外部數據集(如Chen-Gene, Dai-FIG)中表現良好,但在其他數據集中表現較弱(圖4B)。這可能是由于過擬合所得模型的泛化性較差所致。我們的signature通過兩種機器學習算法進行了降維,因此具有更好的外推潛力。
圖4 CRC中基于基因表達的預后標志比較
7. 在臨床內部隊列中驗證
為了進一步驗證IRLS模型在臨床中的性能,下一步通過qRT-PCR分析評估了232例CRC患者的臨床隊列中這些lncRNAs的表達。Kaplan-Meier分析一致表明,高IRLS患者的OS和RFS顯著較差(P < 0.0001)(圖5A, B)。在對混雜變量(包括年齡、性別、T分期、N分期、M分期、AJCC分期、microsatellite state、化療、ICI治療)進行控制后,IRLS模型對OS而非RFS仍具有統計學意義(圖5C、D),這與上述結果一致。ROC分析顯示IRLS具有更高的準確性:預測1、3和5年OS的AUC分別為0.840、0.776和0.818(圖5E)。同樣,c指數達到0.765 (95% CI = 0.691 0.839)。此外,比較了IRLS與其他臨床特征的預測優勢,觀察到IRLS保持最佳性能(圖5F)。總之,一項臨床內部隊列研究的結果支持我們的發現,驗證并證實了IRLS模型是相當穩健的,可以作為CRC預后的獨立預測因素。
圖5臨床內部隊列驗證
8. 基于氟尿嘧啶的ACT和貝伐珠單抗受益的預測價值
越來越多的證據表明,lncRNAs與基于氟尿嘧啶的ACT和貝伐珠單抗的敏感性和耐藥性有關。在此,進一步評估了IRLS對量化基于氟尿嘧啶的ACT和貝伐珠單抗療效的預測價值。作者發現,在GSE19860、GSE28702、GSE45404、GSE69657和GSE72970中,有應答者的IRLS評分明顯高于無應答者(P均< 0.05)(圖6A-E)。應答者在GSE62080中有更高的IRLS趨勢,但這并不顯著(圖6F),這可能與樣本量小有關(n = 21)。ROC分析顯示,IRLS可以準確預測基于氟尿嘧啶的ACT的療效,其AUC值較高的有GSE19860(0.843)、GSE28702(0.778)、GSE45404(0.693)、GSE69657(0.765)、GSE72970(0.709)和GSE62080(0.722)(圖6G-L)。同樣,應答組的IRLS也更高(圖6M),RLS也可以明顯區分氟尿嘧啶ACT的應答者和無應答者(AUC = 0.854)(圖6N)。
與單獨使用基于氟尿嘧啶的ACT相比,對貝伐珠單抗敏感的患者在GSE19860 (P = 0.075)、GSE19862 (P = 0.112)和GSE72970 (P = 0.011)中表現出較低的IRLS水平(圖6O-Q)。在三個獨立數據集中,預測貝伐珠單抗療效的IRLS的AUC分別為0.771、0.694和0.781(圖6R-T)。這表明IRLS在貝伐珠單抗中也有良好的表現。綜合來看,IRLS高的患者往往對氟尿嘧啶ACT敏感,對貝伐珠單抗耐藥,而IRLS低的患者往往對貝伐珠單抗敏感,對氟尿嘧啶ACT耐藥。
圖6基于氟尿嘧啶的ACT和貝伐珠單抗療效的預測價值
9. IRLS對ICI治療的意義
細胞浸潤分析顯示,在TCGA-CRC和Meta-GEO隊列中,IRLS與免疫浸潤豐度呈顯著負相關(圖7A、B)。同樣,IRLS和CD8A散點圖在隊列(r = 0.674,圖7D)中顯示出負相關。為了進一步驗證CD8A蛋白在IRLS不同水平的表達,對石蠟切片進行了免疫組化。免疫組化圖像和評分顯示,低危組CD8A表達顯著增高(圖7E, F)。這表明低IRLS的患者可能擁有更多的ICI治療后備資源。此外,IRLS也與TCGA-CRC中PD-L1的表達呈負相關(r = 0.612,圖7G)和隊列(r = 0.548,圖7H)。在蛋白質水平上也發現了這一一致的發現(圖7I, J)。IRLS能夠準確預測TCGC-CRC中dMMR/M SI-H表型(AUC = 0.883)、Meta-GEO (AUC = 0.778)和內部隊列(AUC = 0.794)(圖7K M),這表明IRLS是microsatellite state評估的良好替代。ROC分析顯示,IRLS也能明顯區分派姆單抗的應答者和無應答者(AUC = 0.897),且明顯優于PDL1 (AUC = 0.686, P<0.001)和CD8A (AUC = 0.725, P <0.01)表達(圖7N)。
圖7 IRLS對ICI治療的意義
結論:
基于大量生物信息學和機器學習算法,作者開發了一個穩定而強大的signature,用于評估基于氟尿嘧啶的ACT、貝伐珠單抗和派姆單抗的預后、復發和益處。該IRLS模型是一個有前景的工具,可以優化單個CRC患者的決策和監測方案。
參考文獻:
Liu Z, Liu L, Weng S, Guo C, Dang Q, Xu H, Wang L, Lu T, Zhang Y, Sun Z, Han X. Machine learning-based integration develops an immune-derived lncRNA signature for improving outcomes in colorectal cancer. Nat Commun. 2022;13(1):816. doi: 10.1038/s41467-022-28421-6