NAR雜志2月刊上,腫瘤研究者最愛的癌癥基因組圖譜集(The Cancer Genome Atlas,TCGA)數(shù)據(jù)又有新的數(shù)據(jù)挖掘文章發(fā)表啦!快和小編一起看看這次又是什么“套路”吧!
一張圖快速了解TCGA
文章題目:The association between copy number aberration, DNA methylation and gene expression in tumor samples
中文題目:腫瘤樣本的體細胞拷貝數(shù)變異,DNA甲基化和基因表達的相關(guān)性分析
發(fā)表日期: 2018 Feb 26
影響因子:10.162
研究背景
1) 研究目的在于進行TCGA開放數(shù)據(jù)的深度挖掘。
2) 系統(tǒng)分析6個癌種的體細胞拷貝數(shù)變異 (SCNA), DNA甲基化和基因表達之間的相關(guān)性,包括乳腺癌(BRCA),結(jié)腸癌(COAD),急性髓樣白血?。?/span>LAML),成膠質(zhì)細胞瘤(GBM),低級膠質(zhì)瘤(LGG)和前列腺癌(PRAD)。
研究方法
1) 數(shù)據(jù)準備
2) 樣本篩選
因為TCGA沒有提供人群信息,本研究基于基因型的主成分分析方法,主要篩選歐洲人群。
研究結(jié)果
(以乳腺癌為主要展示結(jié)果,其它作者放在補充材料進行展示)
1) SCNA 與基因表達或者DNA甲基化的關(guān)系
a) SCNA主要影響臨近基因組區(qū)域的表達或者甲基化,且SCNA與表達多正相關(guān),而與甲基化可以正相關(guān)也可以負相關(guān)。
b) 研究者注意到數(shù)據(jù)分析時,協(xié)變量的控制很關(guān)鍵(batch效應,腫瘤亞型和腫瘤純度等)。
c) 基于SCNA與甲基化的相關(guān)性分析,發(fā)現(xiàn)16號染色體有個高度集中相關(guān)區(qū)域??赡芤驗檫@個區(qū)域CTCF基因的拷貝數(shù)變化。CTCF為重要的表觀調(diào)控轉(zhuǎn)錄因子,因此這個區(qū)域的拷貝數(shù)和甲基化程度緊密相關(guān)(下圖)
2) 基因表達和DNA甲基化的關(guān)系
a) 腫瘤純度嚴重影響了腫瘤樣本中基因表達和DNA甲基化的相關(guān)性(下圖)
圖:是否對腫瘤純度進行質(zhì)控的相關(guān)性差別,左圖(未質(zhì)控),右圖(質(zhì)控)
b) 低度甲基化(cold)和高度甲基化(hot)區(qū)域的分布,提示腫瘤甲基化研究中對CpG shore的關(guān)注需要重視(下圖)
3) 探討SCNA,甲基化和表達的相互關(guān)系
以多種模型探討三者的關(guān)系,如下圖,主要包括:因果關(guān)系,被動關(guān)系和條件獨立關(guān)系。結(jié)果發(fā)現(xiàn)條件獨立模型在所有癌種中的占比最高。
討論
本研究的意義:
提示腫瘤組織的細胞組成對甲基化和基因表達相關(guān)性分析的重要性,本研究開發(fā)的模型適宜于此類分析中協(xié)變量的矯正;
提示DNA甲基化與體細胞拷貝數(shù)變異可能正相關(guān)也可能是負相關(guān);
首次探討了體細胞拷貝數(shù)變異,甲基化,基因表達三者之間的調(diào)控關(guān)系,需要后續(xù)功能實驗的進一步驗證。