侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

TCGA預(yù)后基因聯(lián)合免疫浸潤(rùn)

2021-01-05 08:43
科研菌
關(guān)注

通過(guò)ESTIMATE算法計(jì)算免疫,間質(zhì)和ESTIMATE得分,并以此篩選DEGs,進(jìn)行生存分析、KEGG、GO、GSEA分析,構(gòu)建PPI網(wǎng)絡(luò)并篩選hub基因,最后通過(guò)構(gòu)建風(fēng)險(xiǎn)評(píng)分(RS)模型,研究hub基因的預(yù)后價(jià)值并用驗(yàn)證集進(jìn)行驗(yàn)證。

題目:從TCGA數(shù)據(jù)庫(kù)中篩選對(duì)急性髓系白血病有預(yù)后價(jià)值的基因

一.研究背景

急性髓系白血病(AML)是一種造血克隆性惡性腫瘤。AML患者的治療和預(yù)后取決于準(zhǔn)確的細(xì)胞遺傳學(xué)和基因檢測(cè)。AML疾病狀況的改善主要得益于支持療法和造血細(xì)胞移植的進(jìn)步。然而,由于高復(fù)發(fā)率,AML的5年生存率仍然很低,因此迫切需要新穎有效的治療方法。從免疫治療的角度出發(fā),希望找到與AML的腫瘤微環(huán)境相關(guān)的具有預(yù)后價(jià)值的基因。

二.分析流程

三.結(jié)果解讀

1.?dāng)?shù)據(jù)收集與處理

收集了TCGA中三級(jí)AML患者的轉(zhuǎn)錄組資料,即入選的樣本在樣本ID中以"-03"結(jié)尾,屬于"原發(fā)性血源癌-外周血"。一共入選了173例樣本。使用GDC工具提取樣本的臨床特征和生存數(shù)據(jù),使用limma包進(jìn)行歸一化處理。

2. 免疫評(píng)分與癌癥和急性白血病B組(CALGB)細(xì)胞遺傳學(xué)風(fēng)險(xiǎn)類別和生存結(jié)果相關(guān)

使用ESTIMATE算法分別計(jì)算樣本的免疫評(píng)分、基質(zhì)評(píng)分和ESTIMATE評(píng)分。繪制箱線圖,觀察上述評(píng)分與CALGB細(xì)胞遺傳學(xué)風(fēng)險(xiǎn)類別的關(guān)系。

免疫評(píng)分越高與CALGB細(xì)胞遺傳學(xué)風(fēng)險(xiǎn)類別的風(fēng)險(xiǎn)等級(jí)越高相關(guān)(P=0.0396,圖1A)。

基質(zhì)評(píng)分和ESTIMATE評(píng)分未觀察到與CALGB細(xì)胞遺傳學(xué)風(fēng)險(xiǎn)類別之間的顯著性(分別為P = 0.8585和P = 0.3320,圖1B,C)。

根據(jù)免疫評(píng)分、基質(zhì)評(píng)分和ESTIMATE評(píng)分的中位數(shù)分別將AML樣本分為高分組和低分組,繪制生存曲線,評(píng)估這三個(gè)評(píng)分與總體生存率之間的關(guān)系。

免疫評(píng)分和ESTIMATE評(píng)分越高,總體生存情況越差(分別為P=0.0224,P=0.0195,圖1D,F(xiàn))。

基質(zhì)評(píng)分的不同水平與總體生存率之間無(wú)顯著關(guān)系(P=0.3676,圖1E)。

圖1 免疫評(píng)分、基質(zhì)評(píng)分、ESTIMATE評(píng)分在CALGB細(xì)胞遺傳學(xué)風(fēng)險(xiǎn)類別中的分布情況箱線圖以及生存曲線

3.AML中基于免疫評(píng)分和基質(zhì)評(píng)分的表達(dá)譜比較

將免疫評(píng)分和基質(zhì)評(píng)分按中位數(shù)分為高組和低組,分別繪制基因表達(dá)熱圖(圖2A,圖3A)。并根據(jù)免疫評(píng)分和基質(zhì)評(píng)分的高低組分別篩選DEGs(PFDR < 0.05 , |log2FC| > 1),繪制火山圖(圖2B,圖3B)。通過(guò)Venn圖對(duì)兩組獲得的DEGs取交集。

在免疫評(píng)分組中篩選了331個(gè)上調(diào)的DEGs和889個(gè)下調(diào)的DEGs。

在基質(zhì)評(píng)分組中篩選了195個(gè)上調(diào)的DEG和870個(gè)下調(diào)的DEGs。

在Venn圖中,篩選出147個(gè)有交集的上調(diào)基因(圖2C)和680個(gè)有交集的下調(diào)基因(圖2D)。

圖2 基于免疫評(píng)分分組的表達(dá)譜熱圖、火山圖以及Venn圖

圖3 基于基質(zhì)評(píng)分分組的表達(dá)譜熱圖、火山圖

4.功能富集分析

對(duì)上一步得到的有交集的DEGs進(jìn)行GO和KEGG富集分析。結(jié)果顯示這些DEGs和免疫反應(yīng)存在顯著關(guān)聯(lián)。

GO分析主要富集于炎癥反應(yīng)、免疫反應(yīng)、細(xì)胞膜、受體活性。圖4A,B,C分別展示了生物過(guò)程、細(xì)胞成分和分子功能的前10個(gè)條目。

在KEGG通路注釋(圖4D)和富集分析(圖4E)中,主要是與免疫、癌癥和結(jié)核病相關(guān)的通路。通路富集分析的前20條結(jié)果如圖4F所示。

圖4 GO和KEGG分析結(jié)果

5.PPI網(wǎng)絡(luò)的構(gòu)建以及hub基因篩選

使用STRING數(shù)據(jù)庫(kù)構(gòu)建了包含786個(gè)節(jié)點(diǎn)和1774條邊的PPI網(wǎng)絡(luò)。使用Cytoscape的cytoHubba插件來(lái)識(shí)別hub基因,從12種算法中選擇了前10個(gè)節(jié)點(diǎn),并排除了degree<10的基因。最后,確定了18個(gè)TME相關(guān)的hub基因:ITGAL、ITGAM、HLA-DRB1、HLA-DRB5、FPR1、CX3CR1、TNFRSF1B、CXCL16、CTSB、CTSS、HLA-DRA、P2RY13、ITGB2、CEACAM3、SLC11A1、C5AR1、ADORA3和GNGT2。

圖5 cytoHubba插件基于12種算法進(jìn)行hub基因識(shí)別

6.GSEA分析

隨后進(jìn)行GSEA分析,并設(shè)置FDR<0.25、|enriched score|> 0.35、基因集內(nèi)基因數(shù)≥35。

GSEA的結(jié)果表明:抗原加工和呈遞,B細(xì)胞受體信號(hào)傳導(dǎo)通路,趨化因子信號(hào)傳導(dǎo)通路,F(xiàn)cγR介導(dǎo)的吞噬作用,移植物與宿主疾病,造血細(xì)胞譜系,產(chǎn)生IgA的腸道免疫網(wǎng)絡(luò),NK細(xì)胞介導(dǎo)的細(xì)胞毒性,NOD樣受體信號(hào)傳導(dǎo)通路,T細(xì)胞受體信號(hào)傳導(dǎo)通路和Toll樣受體信號(hào)傳導(dǎo)通路是腫瘤免疫相關(guān)交叉基因富集的主要通路(圖6)。

圖6 GSEA分析的結(jié)果

7.風(fēng)險(xiǎn)評(píng)分和生存分析

基于多變量Cox回歸分析,計(jì)算出每個(gè)AML患者的風(fēng)險(xiǎn)評(píng)分(RS)公式。

RS = ITGAL * 0.177 + ITGAM * 0.315 + HLA-DRB1 * 0.371 + HLA-DRB5 * (?0.009) + FPR1 * 0.034 + CX3CR1 * (?0.074) + TNFRSF1B * 0.172 + CXCL16 * (?0.104) + CTSB * (?0.38) + CTSS * (?0.201) + HLA-DRA * (?0.353) + P2RY13 * 0.003 + ITGB2 * 0.038 + CEACAM3 * (?0.051) + SLC11A1 * (?0.034) + C5AR1 * (?0.049) + ADORA3 * 0.213 + GNGT2 * 0.208

隨后根據(jù)中位數(shù)將163例AML患者分為低RS組和高RS組,進(jìn)行生存分析,研究不同RS水平與總體生存率之間的關(guān)系。結(jié)果表明,高RS與不良的總生存期有關(guān)(圖7A)。然后繪制ROC曲線,并計(jì)算曲線下面積AUC為0.725,顯示出RS對(duì)總體生存率的預(yù)測(cè)準(zhǔn)確性較高(圖7B)。

圖7 RS的預(yù)后價(jià)值

此外,還繪制了18個(gè)hub基因的生存曲線,以探討預(yù)后價(jià)值(圖8)。結(jié)果顯示,hub基因的高表達(dá)水平與不良的總體生存率有關(guān)。

圖8 18個(gè)hub基因的K-M曲線

8.Vizome數(shù)據(jù)庫(kù)分析

Vizome是最大的AML數(shù)據(jù)庫(kù),它包含了從562名患者收集的672份腫瘤樣本的全外顯子組測(cè)序數(shù)據(jù)。驗(yàn)證了Vizome數(shù)據(jù)庫(kù)中hub基因的表達(dá)水平。熱圖顯示,18個(gè)hub基因在數(shù)據(jù)庫(kù)中的樣本中表現(xiàn)出高表達(dá)(圖9A)。圖9B中還顯示了其中4個(gè)hub基因的相互作用關(guān)系。

圖9 驗(yàn)證Vizome數(shù)據(jù)庫(kù)中hub基因的表達(dá)水平

小結(jié)

       利用TCGA數(shù)據(jù)庫(kù),基于ESTIMATE算法得出的免疫評(píng)分和基質(zhì)評(píng)分得到了可預(yù)測(cè)AML患者預(yù)后不良的TME相關(guān)基因,并對(duì)其進(jìn)行對(duì)進(jìn)行功能富集分析。構(gòu)建PPI網(wǎng)絡(luò),篩選得到TME相關(guān)的hub基因,并構(gòu)建RS模型,為預(yù)測(cè)AML患者的生存狀況提供了新的依據(jù)。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)