近來(lái)天昊生物為多家合作單位介紹了SNP聯(lián)合expression數(shù)據(jù)進(jìn)行表達(dá)數(shù)量性狀位點(diǎn)分析(eQTL),以及SNP聯(lián)合methylation數(shù)據(jù)進(jìn)行甲基化數(shù)量性狀位點(diǎn)分析(meQTL),旨在從多組學(xué)數(shù)據(jù)分析和挖掘中尋找新的研究思路,同時(shí)可以將以往的SNP/GWAS數(shù)據(jù)重新利用起來(lái)。這樣的研究思路可以應(yīng)用在多種復(fù)雜疾病中,包括癌癥,從文獻(xiàn)檢索結(jié)果中看,類似思路的文章并不多,然而實(shí)現(xiàn)這樣的QTL分析文章檔次均很高。今天小編就為您介紹兩款數(shù)據(jù)庫(kù):泛癌種中SNP如何影響基因表達(dá)和甲基化,進(jìn)行QTL數(shù)據(jù)分析。
華中科技大學(xué)及德克薩斯大學(xué)休斯頓健康科學(xué)中心的團(tuán)隊(duì)合作于2018年1月4日及9月7日在《Nucleic Acids Research》雜志上分別發(fā)表了PancanQTL和Pancan-meQTL兩款數(shù)據(jù)庫(kù)文章1,2。
PancanQTL和Pancan-meQTL兩款數(shù)據(jù)庫(kù)的數(shù)據(jù)均來(lái)源于The Cancer Genome Atlas (TCGA)數(shù)據(jù)庫(kù),分別介紹了33種癌癥的eQTL數(shù)據(jù)以及23種癌癥的meQTL數(shù)據(jù),QTL數(shù)據(jù)又分為cis-QTL和trans-QTL,數(shù)據(jù)處理過(guò)程類似,包括基因型數(shù)據(jù)、表達(dá)數(shù)據(jù)及甲基化數(shù)據(jù)收集和處理;協(xié)變量分析;eQTL及meQTL識(shí)別;survival相關(guān)的eQTL/meQTL及GWAS相關(guān)的eQTL/meQTL分析等。
(一)
PancanQTL數(shù)據(jù)庫(kù)鏈接為http://bioinfo.life.hust.edu.cn/PancanQTL/,如下圖所示主要包含四類數(shù)據(jù):Cis-eQTLs, Trans-eQTLs, Survival-eQTLs及GWAS-eQTLs。
在進(jìn)行eQTL識(shí)別分析中包含一系列SNP及表達(dá)數(shù)據(jù)過(guò)濾的過(guò)程,利用Cis-eQTLs和Trans-eQTLs,結(jié)合TCGA中臨床數(shù)據(jù)得到Survival-associated eQTLs,結(jié)合GWAS catalog數(shù)據(jù)得到GWAS-related eQTLs。
從網(wǎng)站鏈接中我們點(diǎn)擊Cis-eQTLs,Cancer type中選擇肺腺癌LUAD(N=514),可以輸入SNP ID或Gene symbol,比如這里輸入KRAS基因,點(diǎn)擊search,會(huì)顯示顯著性結(jié)果。這些結(jié)果提示4個(gè)SNP位點(diǎn)會(huì)顯著影響KRAS基因的表達(dá)水平,這樣的信息可能對(duì)相關(guān)的研究有一定的輔助作用,我們可以針對(duì)多個(gè)目的基因驗(yàn)證其SNP和表達(dá)數(shù)據(jù),結(jié)合前期研究及其它數(shù)據(jù)找到新的線索。
比如我們點(diǎn)擊第一個(gè)Box Plot,發(fā)現(xiàn)該位點(diǎn)不同基因型下KRAS基因表達(dá)存在顯著差異,圖的信息可以下載PDF格式直接利用。
當(dāng)然也可以對(duì)Cis-eQTLs和Trans-eQTLs數(shù)據(jù)進(jìn)行下載,或者按SNP, gene or region進(jìn)行搜索。
(二)
Pancan-meQTL數(shù)據(jù)庫(kù)鏈接為http://bioinfo.life.hust.edu.cn/Pancan-meQTL/,與PancanQTL類似,數(shù)據(jù)主要包括Pancan-meQTLs, Cis-meQTLs, Trans-meQTLs, Survival-meQTLs及GWAS-meQTLs。
SNP和甲基化數(shù)據(jù)分析流程及使用的軟件如下。
點(diǎn)擊鏈接中pancan-meQTLs,例如在Gene symbol中輸入KRAS基因,同時(shí)勾選Cis-meQTL和Trans-meQTL提交能夠顯示KRAS基因在23個(gè)癌種中SNP-methylation的Cis-及Trans-數(shù)據(jù),這些結(jié)果可以直接下載。
其它的功能類似于PancanQTL數(shù)據(jù)庫(kù),例如點(diǎn)擊Cis-meQTLs,Cancer type中選擇肺腺癌LUAD(N=448),可以輸入SNP ID、Methylation Probe或Gene symbol,比如這里輸入EGFR基因,點(diǎn)擊search,會(huì)顯示顯著性結(jié)果。
結(jié)果中我們能夠看到多個(gè)SNP位點(diǎn)及甲基化探針數(shù)據(jù),相關(guān)系數(shù)以及對(duì)應(yīng)p值,點(diǎn)擊第一個(gè)Box Plot,發(fā)現(xiàn)該SNP位點(diǎn)不同基因型對(duì)應(yīng)的甲基化位點(diǎn)其甲基化水平有顯著差異,同樣的位點(diǎn)基因的表達(dá)水平又如何呢,相應(yīng)的甲基化位點(diǎn)是否影響該基因的表達(dá)?這就需要進(jìn)一步探索了。
天昊生物在SNP分型及數(shù)據(jù)分析上擁有無(wú)可比擬的優(yōu)勢(shì),多項(xiàng)專利技術(shù)能夠滿足各種通量的SNP分型研究。同時(shí)擁有目的區(qū)域甲基化測(cè)序MethylTarget?專利技術(shù),因此完全滿足針對(duì)今天介紹的兩款數(shù)據(jù)庫(kù)中批量數(shù)據(jù)的驗(yàn)證,滿足您在復(fù)雜疾病研究中有關(guān)eQTL/meQTL分析的科研需求,而類似研究思路的文章在某些疾病中確實(shí)罕見(jiàn)!
參考文獻(xiàn)
1. Gong J, Mei S, Liu C, et al. PancanQTL: systematic identification of cis-eQTLs and trans-eQTLs in 33 cancer types. Nucleic acids research 2018;46:D971-D6.
2. Gong J, Wan H, Mei S, et al. Pancan-meQTL: a database to systematically evaluate the effects of genetic variants on methylation in human cancer. Nucleic acids research 2018.