訂閱
糾錯(cuò)
加入自媒體

如何使用TCGAbiolinks進(jìn)行數(shù)據(jù)預(yù)處理?

2021-01-07 09:31
科研菌
關(guān)注

引言:在前面我們了解了如何使用TCGAbiolinks檢索并獲取TCGA數(shù)據(jù)庫(kù)的公開數(shù)據(jù)。今天小編就用前面涉及到的代碼,下載今天數(shù)據(jù)準(zhǔn)備需要用到的TCGA樣本數(shù)據(jù)。

一、數(shù)據(jù)下載階段

第一步:GDCquery()篩選我們需要的數(shù)據(jù),TCGAbiolinks包下載TCGA數(shù)據(jù)進(jìn)行表達(dá)差異分析-肝癌案例

library("TCGAbiolinks")

query <- GDCquery(project = "TCGA-LIHC",

data.category = "Transcriptome Profiling",

data.type = "Gene Expression Quantification",

workflow.type = "HTSeq - Counts")

上圖為通過(guò)TCGA GDC鏈接中根據(jù)篩選條件查看的符合要求結(jié)果。下圖為通過(guò)GDCquery()函數(shù)中傳入對(duì)應(yīng)的參數(shù)得到的結(jié)果。兩者對(duì)比,我們可以發(fā)現(xiàn),兩者是一模一樣的。說(shuō)明代碼執(zhí)行正確。前面一期中,我們有詳細(xì)談及 GDCquery,可做參考。

samplesDown <- getResults(query,cols=c("cases"))

#getResults(query, rows, cols)根據(jù)指定行名或列名從query中獲取結(jié)果,此處用來(lái)獲得樣本的barcode

# 此處共檢索出424個(gè)barcodes

getResults()中用到的參數(shù):

參數(shù)用法query
來(lái)自GDCquery的結(jié)果rows用于指定特定的行cols用于指定特定的列

# 從samplesDown中篩選出TP(實(shí)體腫瘤)樣本的barcodes

# TCGAquery_SampleTypes(barcode, typesample)

# TP代表PRIMARY SOLID TUMOR;NT-代表Solid Tissue Normal(其他組織樣本可參考學(xué)習(xí)文檔)

##此處共檢索出371個(gè)TP樣本barcodes

dataSmTP <- TCGAquery_SampleTypes(barcode = samplesDown,

typesample = "TP")

# 從samplesDown中篩選出NT(正常組織)樣本的barcode

#此處共檢索出50個(gè)NT樣本barcodes

dataSmNT <- TCGAquery_SampleTypes(barcode = samplesDown,

typesample = "NT")

TCGAquery_SampleTypes中的參數(shù)詳解:

參數(shù)用法barcodeTCGA中的barcodes列表typesample用于指定篩選哪種類型的組織樣本,如腫瘤組織“TP”,正常組織“NT”

補(bǔ)充TCGA中的組織樣本類型:

TPPRIMARY SOLID TUMORTMMetastaticTRRECURRENT SOLID TUMORTAMAdditional MetastaticTBPrimary Blood Derived Cancer-Peripheral BloodTHOCHuman Tumor Original CellsTRBMRecurrent Blood Derived Cancer-Bone MarrowTBM Primary Blood Derived Cancer-Bone MarrowTAPAdditional-New PrimaryNB Blood Derived Normal NTSolid Tissue NormalNBCBuccal Cell Normal???NEBVEBV Immortalized NormalNBMBone Marrow Normal

1  2  3  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)