SNP關(guān)聯(lián)研究或者GWAS研究的陽(yáng)性位點(diǎn),大部分時(shí)候總能很優(yōu)秀的落在非編碼區(qū)。
這些非編碼SNP到底影響了什么???
別著急,給你推薦2個(gè)數(shù)據(jù)庫(kù)挖挖看,或許就有收獲。
◆ENCODE數(shù)據(jù)庫(kù)(Encyclopedia of DNA Elements, https://www.encodeproject.org/):由美國(guó)國(guó)家人類基因組研究所(NHGRI)在2003年發(fā)起的一個(gè)項(xiàng)目,主要存放了人類、小鼠、果蠅、蠕蟲這4個(gè)物種的多種細(xì)胞和組織類型的各種調(diào)控過(guò)程的測(cè)序結(jié)果(The primary goal of the ENCODE project is to determine the role of the remaining component of the genome, much of which was traditionally regarded as "junk.")。這一項(xiàng)目的研究人員對(duì)147種細(xì)胞系進(jìn)行了將近1,650次實(shí)驗(yàn),涉及分子轉(zhuǎn)錄,轉(zhuǎn)錄因子結(jié)合,染色體拓?fù)浣Y(jié)構(gòu),組蛋白修飾,DNA甲基化等多方面表觀遺傳學(xué)內(nèi)容。2008年,也就是NHGRI啟動(dòng)ENCODE計(jì)劃的五年后,NIH又開(kāi)始了第二項(xiàng)大規(guī)模圖譜繪制工程:表觀基因組學(xué)路線圖項(xiàng)目(Roadmap Epigenomics Program),這一項(xiàng)目整理了61個(gè)“完整”的表觀基因組,并且未來(lái)還計(jì)劃進(jìn)行更多的研究。大量的表觀遺傳學(xué)數(shù)據(jù),可能能夠?yàn)榉蔷幋a區(qū)的SNP調(diào)控功能提供解釋。
HaploReg和RegulomeDB數(shù)據(jù)庫(kù),將ENCODE數(shù)據(jù)庫(kù)中的調(diào)控?cái)?shù)據(jù)與基因組中SNP數(shù)據(jù)結(jié)合起來(lái),從而實(shí)現(xiàn)了對(duì)SNP調(diào)控功能的綜合評(píng)價(jià)。
●網(wǎng)址:
https://pubs.broadinstitute.org/mammals/haploreg/haploreg.php
●數(shù)據(jù)輸入頁(yè)面
●以rs2854510為例的綜合結(jié)果展示頁(yè)面,每個(gè)SNP的詳細(xì)注釋結(jié)果需點(diǎn)擊SNP的名字
1. SiPhy cons:序列保守性注釋(SiPhy軟件)。
2. Promoter histone marks,Enhancer histone markers,DNAse:來(lái)源于DNAse和ChIP-Seq實(shí)驗(yàn)的調(diào)控元件分類注釋結(jié)果,包括是否處于組蛋白修飾位置(promoter,enhancer等);屬于什么染色質(zhì)狀態(tài)Chromatin States(來(lái)自Roadmap項(xiàng)目);是否處于染色質(zhì)開(kāi)放區(qū)域(DHS區(qū)域)。
1)Chromatin states (Core 15-state model)
包括前面8個(gè)活躍狀態(tài)和后面7個(gè)抑制狀態(tài),具體含義和縮寫見(jiàn)下圖。
2) Chromatin states (25-state model using 12 imputed marks)
具體含義和縮寫見(jiàn)下圖。
3)H3K4me1, 與基因的轉(zhuǎn)錄激活有關(guān),代表此處是轉(zhuǎn)錄增強(qiáng)子peak
4)H3K4me3, 與基因的轉(zhuǎn)錄激活有關(guān),代表此處是啟動(dòng)子區(qū)peak
5)H3K27ac,與基因的轉(zhuǎn)錄激活有關(guān),代表此處是轉(zhuǎn)錄增強(qiáng)子peak
6) H3K9ac, 與基因的轉(zhuǎn)錄激活有關(guān),代表此處是啟動(dòng)子區(qū)peak
7) DNase,說(shuō)明此處對(duì)DNaseⅠ表現(xiàn)出高度敏感,處于轉(zhuǎn)錄活躍區(qū)
3.Proteins bound :基于ChIP-Seq 實(shí)驗(yàn),展示在何種細(xì)胞中SNP處于何種轉(zhuǎn)錄因子的結(jié)合位點(diǎn).
具體信息需要查看SNP位點(diǎn)詳細(xì)頁(yè)面的信息:
4.Motifs changed:基于ENCODE 的轉(zhuǎn)錄因子CHIP-SEQ數(shù)據(jù),整理了這些轉(zhuǎn)錄因子的基因組結(jié)合motif。這里會(huì)展示SNP的兩個(gè)堿基對(duì)motif的影響。
5.NHGRI/EBI GWAS hits:基于NHGRI catalog,提示該SNP是GWAS研究的陽(yáng)性位點(diǎn)
6.GRASP QTL hits:基于GRASP數(shù)據(jù)庫(kù),提示該SNP是某個(gè)性狀的陽(yáng)性位點(diǎn)
7.Selected eQTL:基于GTEx analysis V6, the GEUVADIS analysis, 和其它10篇文獻(xiàn),提示該SNP在XXX組織中調(diào)控XXX基因表達(dá)
●網(wǎng)址:
https://www.regulomedb.org/regulome-search
●數(shù)據(jù)輸入頁(yè)面:
●結(jié)果綜合展示頁(yè)面
第三列Rank的解讀:
第四列Score解讀:
RegulomeDB概率得分從0到1不等,1代表最可能是調(diào)控變異。RegulomeDB得分基于功能基因組學(xué)特征以及實(shí)驗(yàn)來(lái)源的連續(xù)值,如ChIP-seq信號(hào)、DNase-seq信號(hào)、信息含量變化和DeepSEA得分等。詳細(xì)信息可參考最新文獻(xiàn):
Dong S and Boyle AP. Predicting functional variants in enhancer and promoter elements using RegulomeDB. Human Mutation 2019, 40:1292-1298. PMID: 31228310.
概率得分和第三列的Rank之間總體上是正相關(guān)的,但也有一些例外,因?yàn)?)預(yù)測(cè)概率得分時(shí)增加了一些額外的特征數(shù)據(jù)。2)概率評(píng)分中使用的特征與rank評(píng)分的權(quán)重不同。
●點(diǎn)擊rs3768324,獲得詳細(xì)注釋信息
細(xì)節(jié)數(shù)據(jù)基本是和Haploreg重疊的,展示的細(xì)節(jié)略有區(qū)別,建議老師們兩個(gè)數(shù)據(jù)庫(kù)都進(jìn)行查詢和參考。
擴(kuò)展閱讀:
基于HaploReg和RegulomeDB數(shù)據(jù)庫(kù)的生信挖掘文章:Liao, X., Lan, C., Liao, D. et al. Exploration and detection of potential regulatory variants in refractive error GWAS. Sci Rep 6, 33090 (2016). https://doi.org/10.1038/srep33090
SNP位點(diǎn)基于HaploReg和RegulomeDB數(shù)據(jù)庫(kù)進(jìn)行功能注釋:Song J, Yang Y, Mauvais-Jarvis F, Wang YP, Niu T. KCNJ11, ABCC8 and TCF7L2 polymorphisms and the response to sulfonylurea treatment in patients with type 2 diabetes: a bioinformatics assessment. BMC Med Genet. 2017;18(1):64. Published 2017 Jun 6. doi:10.1186/s12881-017-0422-7
天昊生物
幫您更好的完成實(shí)驗(yàn),
幫您認(rèn)識(shí)更好的數(shù)據(jù)庫(kù)!
歡迎聯(lián)系我們!
電話:18964693703(微信同號(hào))
公司網(wǎng)址:www.geneskybiotech.com