使用DriverPower識別癌癥driver基因的綜合負荷和功能影響測試
今天跟大家分享的是2020年發(fā)表在Nat.Commun .(IF:12.121)雜志上的一篇文章Combined burden and functional impact tests for cancer driver discovery using DriverPower.在文章中作者描述了一種新的高靈敏度算法DriverPower,用于在全基因組和外顯子組測序數據中識別區(qū)分癌癥的驅動和乘客突變。
Combined burden and functional impact tests for cancer driver discovery using DriverPower
使用DriverPower識別癌癥driver基因的綜合負荷和功能影響測試
(分享者:科研菌-碎碎冰)
一.研究背景
與癌癥發(fā)生發(fā)展相關的重要基因被稱為“驅動基因(driver基因)”,這種基因決定了癌癥的走向:當driver基因發(fā)生突變后,癌細胞就會活躍起來。driver基因突變占腫瘤中體細胞變異比例少,而且在大多數癌癥中,腫瘤內和腫瘤間存在明顯的異質性,背景突變率(BMR)都可能存在數個數量級的差異。此外,大規(guī)模癌癥全基因組測序WGS的出現為人們探索driver基因在非編碼區(qū)中的作用成為可能。但由于突變對基因組非編碼區(qū)的影響人們了解甚少,所以也有不小的挑戰(zhàn)。大多數最新技術通過突變負荷測試(通過將基因組區(qū)域中觀察到的突變率與BMR預期的突變率進行比較)或功能影響測試來檢測陽性選擇信號,從而識別driver基因。由此作者團隊開發(fā)DriverPower算法——使用突變負荷和功能影響評分來識別編碼和非編碼癌癥driver基因。
二.分析流程
三.結果解讀
1.建立BMR模型
作者首先從PCAWG項目獲得WGS體細胞變異數據。在所有腫瘤隊列中,作者觀察到在組織,供體以及基因座水平上的突變率存在很大差異。driver基因突變檢測的精確性需要準確估計整個腫瘤基因組中的BMR(背景突變率),此外還需要考慮到腫瘤類型、供體和基因組區(qū)域之間的廣泛差異(圖S1)。DriverPower通過使用與局部BMR共同變化的基因組特征,來建立BMR模型從而解決這個問題。
圖S1.隊列和供體水平的異質性
背景知識:
目前通過體細胞突變識別癌癥driver基因的分析方法主要有兩種:①背景突變率(BMR)法和②背景突變比例度量法。背景突變率方法的思想是,評估一個基因在癌癥樣本中是否含有比預期更多的體細胞突變。基于比率測量的方法是通過考察一個基因中不同種類體細胞突變數的比例來探測癌癥driver基因。
作者研究了兩種基于基因組特征的BMR建模算法。第一個算法是首先先使用隨機lasso,然后是運用二項式廣義線性模型(GLM),第二種算法則是基于梯度提升機(GBM,一種非線性且非參數的樹集成算法)的算法。為了評估這兩種BMR建模算法,通過隨機采樣基因組坐標,制作了不重疊的1兆堿基對(Mbp)常染色體元件(n = 2521)和訓練基因組元件(n = 867,266)。然后使用五重交叉驗證(cross validation,CV)來預測每個元件的突變數。

請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞