臨床基本信息當(dāng)作變量輕松發(fā)2+分專業(yè)期刊
今天要和大家分享的是一篇2+分的學(xué)習(xí)筆記。這篇學(xué)習(xí)筆記使用了GEO數(shù)據(jù)庫(kù)的數(shù)據(jù),進(jìn)行了差異表達(dá)基因的篩選、GO和KEGG富集分析、PPI網(wǎng)絡(luò)分析,確定了阿爾茨海默病(Alzheimer’s disease,AD)發(fā)病過(guò)程中關(guān)鍵的差異表達(dá)基因(DEGs)和通路,找到了AD的潛在生物標(biāo)志物。
題目:阿爾茨海默病不同腦區(qū)異常調(diào)控基因和通路的鑒定
一、 研究背景
阿爾茨海默病(Alzheimer disease,AD)是一種慢性進(jìn)行性神經(jīng)退行性疾病。目前對(duì)AD的病理生理機(jī)制尚未完全了解。所以這篇學(xué)習(xí)筆記對(duì)阿爾茨海默病患者和正常對(duì)照的腦組織(包括海馬組織—HIP、顳回組織—TG、額回組織—FG和全血—WB)的可用基因表達(dá)譜進(jìn)行了綜合分析。以確定阿爾茨海默病發(fā)病機(jī)制中的關(guān)鍵差異表達(dá)基因和途徑,獲得潛在的阿爾茨海默病診斷生物標(biāo)志物,為今后研究中阿爾茨海默病診斷生物標(biāo)志物和治療靶點(diǎn)的確定提供有價(jià)值的信息。
二、分析流程
三、結(jié)果解讀1. 鑒定差異表達(dá)基因(DEGs)
從GEO數(shù)據(jù)庫(kù)中篩選16個(gè)數(shù)據(jù)集,包括海馬組織(HIP)六個(gè)、顳回組織(TG)三個(gè)、額葉回組織(FG)三個(gè)和全血(WB)四個(gè),詳細(xì)信息如表1所示。篩選標(biāo)準(zhǔn)為:
數(shù)據(jù)集為全基因組表達(dá)數(shù)據(jù)(數(shù)據(jù)完整)
數(shù)據(jù)庫(kù)來(lái)源于所需要研究的組織(數(shù)據(jù)與研究相關(guān))
表1. 數(shù)據(jù)集的詳細(xì)信息
由于在HIP、TG和FG組織中的比較數(shù)據(jù)來(lái)源于多個(gè)數(shù)據(jù)集,所以需要對(duì)這些數(shù)據(jù)使用了log2轉(zhuǎn)換進(jìn)行歸一化處理,并且使用R包 metaMA合并這些數(shù)據(jù)集。接著計(jì)算單個(gè)基因的p值,并使用Benjamini & Hochberg法計(jì)算多重比較校正的錯(cuò)誤發(fā)現(xiàn)率(FDR),然后篩選出FDR < 0.01的基因,于是得到了DEGs。
為了驗(yàn)證在這三個(gè)組織中,對(duì)照組和AD組的基因的表達(dá)是存在差異的,于是利用這些數(shù)據(jù)繪出在三個(gè)組織中的基因表達(dá)熱圖。
熱圖的紅色代表了上調(diào)表達(dá),綠色代表了下調(diào)表達(dá)。以TG組織為例,可以看到在TG中表達(dá)的基因大致可以分成兩類:一類是上面一組,代表了對(duì)照組高表達(dá)而AD組低表達(dá)(左上紅色塊和右上綠色塊);一類是下面一組,代表了對(duì)照組低表達(dá)而AD組高表達(dá)(左下綠色塊和右下紅色塊)。
圖1. 在三個(gè)組織中的差異表達(dá)基因DEGs熱圖
從三個(gè)組織篩選得到的所有數(shù)據(jù)集中篩選出了325個(gè)DEGs。篩選標(biāo)準(zhǔn)為:FDR <0.01(FDR是指錯(cuò)誤發(fā)現(xiàn)率,一般取FDR<0.01作為默認(rèn)標(biāo)準(zhǔn))。圖2中,三個(gè)組織樣本中的差異表達(dá)基因的交集即為3個(gè)組織樣本中表達(dá)均有差異的基因(上調(diào)的117個(gè),下調(diào)的148個(gè),總共325個(gè))。
圖2. 篩選得到的上調(diào)和下調(diào)表達(dá)的DEGs
2. GO和KEGG富集分析
使用Gene codis 3軟件對(duì)未與全血樣本重合的325個(gè)DEGs進(jìn)行富集分析(FDR < 0.05)。富集結(jié)果如下圖3所示。從圖中可以看到這些基因在與AD有關(guān)的信號(hào)通路中出現(xiàn)了顯著的富集,比如:在HIP中,參與粘附體連接的途徑;在FG中,Wnt信號(hào)通路;此外,MAPK信號(hào)通路也出現(xiàn)了明顯的富集。
圖3. KEGG富集分析結(jié)果
325個(gè)DEGs的GO和KEGG富集分析的詳細(xì)結(jié)果如下表所示(表2)。從GO分析結(jié)果可以看出這些基因在凋亡過(guò)程調(diào)節(jié)、凋亡過(guò)程和細(xì)胞死亡等基因功能出現(xiàn)了明顯的富集。
表2. GO和KEGG富集分析表
3. PPI網(wǎng)絡(luò)構(gòu)建
利用BioGRID數(shù)據(jù)庫(kù)和Cytoscape軟件構(gòu)建來(lái)PPI網(wǎng)絡(luò),尋找核心調(diào)控基因(hub genes)。利用前20個(gè)上調(diào)和下調(diào)基因來(lái)構(gòu)建PPI網(wǎng)絡(luò)。
小編以HIP為例(圖4)進(jìn)行說(shuō)明:圖中紅色的圓點(diǎn)代表了上調(diào)表達(dá)的基因,藍(lán)色的圓點(diǎn)代表了下調(diào)表達(dá)的基因,三角形基因代表了與其它基因連接度高的基因。PPI網(wǎng)絡(luò)篩選核心調(diào)控基因的原理也就是根據(jù)一個(gè)基因和其余基因的連接度(connectivity)的大小來(lái)篩選的,簡(jiǎn)而言之就是圖中基因周圍線最多的基因就是我們需要尋找的核心調(diào)控基因。
圖4. 根據(jù)HIP的DEGs構(gòu)建的PPI網(wǎng)絡(luò)
通過(guò)在HIP、TG、FG的PPI網(wǎng)絡(luò)中的基因進(jìn)行連接度從高到低排序,可以得到以下結(jié)果:
在HIP的PPI網(wǎng)絡(luò)中,YAP1的連接度最高,與18個(gè)DEGs相互作用;
在TG的PPI網(wǎng)絡(luò)中,MAPK9的連接度最高,與16個(gè)DEGs相互作用;
在FG的PPI網(wǎng)絡(luò)中,GJA1的連接度最高,與6個(gè)DEGs相互作用。
4. 在全血樣本中尋找DEGs
為了尋找血液中的生物標(biāo)志物,需要單獨(dú)對(duì)全血樣本進(jìn)行差異表達(dá)基因DEGs的篩選,篩選方法同上。作者總共篩選到了2101個(gè)DEGs,并將HIP、TG、FG和WB共有的DEGs篩選出來(lái),總共篩選到了40個(gè)DEGs(圖5)。
圖5. 全血標(biāo)本中基因表達(dá)熱圖(A);利用韋恩圖篩選4個(gè)組織樣本中共有的差異表達(dá)基因(B)
進(jìn)一步將四個(gè)組織樣本中共有的40個(gè)DEGs進(jìn)行富集分析。這些DEGs在脂肪細(xì)胞因子信號(hào)通路、細(xì)胞因子-細(xì)胞因子受體相互作用和阿爾茨海默病相關(guān)通路出現(xiàn)了顯著的富集(圖6)。
圖6. 40個(gè)DEGs的富集結(jié)果
構(gòu)建PPI網(wǎng)絡(luò)發(fā)現(xiàn),在WB的PPI網(wǎng)絡(luò)中,TNFRSF1A和MAP3K5的連接度最高,分別與152個(gè)和76個(gè)DEGs有相互作用(圖7)。
圖7. 根據(jù)WB的DEGs構(gòu)建的PPI網(wǎng)絡(luò)
4. 驗(yàn)證
這一部分分為兩步
第一步的思路是:使用驗(yàn)證集進(jìn)行DEGs的篩選,并與之前篩選得到的40個(gè)DEGs進(jìn)行對(duì)比,驗(yàn)證之前篩選得到的DEGs與驗(yàn)證集是否一致,同時(shí)篩選HIP、TG、FG、WB以及驗(yàn)證集中表達(dá)都有顯著差異的基因用于下一步驗(yàn)證。
第一步的詳細(xì)過(guò)程為:利用腦組織HIP的驗(yàn)證集GSE1297篩選到了35個(gè)DEGs,并比較這35個(gè)基因中31個(gè)常見的基因與之前篩選得到的40個(gè)DEGs的基因表達(dá)情況,發(fā)現(xiàn)它們的表達(dá)上調(diào)或下調(diào)情況一致。然后篩選了HIP、TG、FG、WB以及驗(yàn)證集中表達(dá)都有顯著差異的基因14個(gè)(圖8),這些DEGs包括:
顯著上調(diào)表達(dá)的:ARHGEF40、WWC3、VCAN、SSH3、SAFB2、LRCH4、IL10RA、CDK13、BBX和SPSB3;
顯著下調(diào)表達(dá)的:MRPL15、COPS3、TXNDC9和RAD51C
圖8. 差異表達(dá)基因在正常組織和AD患者HIP組織中的表達(dá)情況(箱線圖左邊代表正常組織,右邊代表了AD患者的HIP組織)
第二步的思路是:對(duì)篩選的到的DEGs的診斷價(jià)值進(jìn)行驗(yàn)證。
第二步的詳細(xì)過(guò)程為:利用全血樣本W(wǎng)B的驗(yàn)證集GSE63060和GSE63061對(duì)上述驗(yàn)證過(guò)程中篩選得到的14個(gè)DEGs進(jìn)行了ROC分析。ROC曲線由pROC繪出,使用AUC(ROC曲線下面積)以評(píng)估各DEG的診斷價(jià)值,當(dāng)AUC值大于0.6時(shí),認(rèn)為DEG能夠區(qū)分病例和正常對(duì)照。結(jié)果發(fā)現(xiàn)在這14個(gè)DEGs中只有MRPL15、RAD51C、SAFB2、SSH3、TXNDC9、VCAN和WWC3能夠區(qū)分AD患者與健康對(duì)照的WB樣本(圖9)。
圖9. 7個(gè)DEGs的ROC曲線
小結(jié)
這篇學(xué)習(xí)筆記先是篩選出AD的HIP、TG和FG組織中的DEGs;然后進(jìn)行GO和KEGG富集分析;接著構(gòu)建了PPI網(wǎng)絡(luò),發(fā)現(xiàn)YAP1、MAPK9和GJA1是HIP、TG和FG組織中的核心調(diào)控基因。為了在血液中尋找生物標(biāo)志物,在WB、HIP、TG和FG找到了表達(dá)都有顯著差異的40個(gè)DEGs;下一步利用驗(yàn)證集對(duì)40個(gè)DEGs進(jìn)一步進(jìn)行篩選,找到了14個(gè)DEGs;最后驗(yàn)證了這14個(gè)DEGs的診斷價(jià)值,發(fā)現(xiàn)有7個(gè)DEGs可以作為診斷標(biāo)志物。這篇學(xué)習(xí)筆記的套路簡(jiǎn)單易懂,值得我們學(xué)習(xí)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
ChatZOC,藏在口袋里的「眼科醫(yī)生」
-
金百澤科技亮相中國(guó)國(guó)際醫(yī)療器械博覽會(huì) | 盡顯醫(yī)療領(lǐng)域硬實(shí)力
-
進(jìn)階的新冠疫苗 又一個(gè)中國(guó)造
-
“AI醫(yī)療第一股”鷹瞳科技上市首日即破發(fā)
-
圓心科技登陸港股,“賣藥的生意”還好不好做?
-
十圖解讀2021年中國(guó)康復(fù)醫(yī)療行業(yè)現(xiàn)狀
-
醫(yī)藥流通數(shù)字化運(yùn)營(yíng)實(shí)現(xiàn)精細(xì)化飼養(yǎng)
-
科學(xué)家發(fā)現(xiàn)人體新器官:將有助于癌癥治療
技術(shù)文庫(kù)
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國(guó)激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢(shì),以Edge AI驅(qū)動(dòng)機(jī)器視覺(jué)升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】從直流到高頻,材料電特性參數(shù)的全面表征與測(cè)量
-
10 GSK膨脹的ADC野望
- 1 2025高端醫(yī)療器械國(guó)產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯(cuò)估了關(guān)稅將對(duì)中國(guó)醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進(jìn)出口報(bào)告:前十大出口市場(chǎng)在哪?
- 4 認(rèn)購(gòu)火爆,映恩生物打響18A IPO重啟信號(hào)槍
- 5 中國(guó)創(chuàng)新藥出海:機(jī)遇、挑戰(zhàn)與未來(lái)展望
- 6 核藥賽道解碼:高壁壘、國(guó)產(chǎn)替代與千億市場(chǎng)卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺(tái)!
- 8 第一醫(yī)藥扣非凈利潤(rùn)僅687.40萬(wàn)元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級(jí)公司
- 10 外骨骼機(jī)器人,誰(shuí)是盈利最強(qiáng)企業(yè)?