數(shù)據(jù)庫背景信息
由于越來越多的測序研究不斷擴充癌癥基因的相關數(shù)據(jù),研究者急需一個能時時更新的癌癥基因綜合信息數(shù)據(jù)庫。因此,研究者在2010年開始建立The Network of Cancer Genes (NCG)數(shù)據(jù)庫,旨在從大量癌癥測序數(shù)據(jù)中收集匯總癌癥基因并給予詳細注釋。
NCG基于專家對癌癥測序篩查研究的分析總結,提取出原始文獻中癌癥基因,并且收集分析該基因各方面的特征性質(zhì)信息(簡單來說,這是一個基于測序研究手動整理的癌癥候選基因百科全書)。目前最新版NCG,共包括了2372個癌癥基因?;?75篇已發(fā)表文章,這些基因的體細胞改變具有已知或預測具有癌癥驅(qū)動作用。NCG同時注釋了癌癥基因的特性,例如多倍性,進化起源,RNA和蛋白表達,miRNA和蛋白互做,以及蛋白功能和其它一些基本特性。NCG目前已更新到第六版,與舊版相比,新版囊括的內(nèi)容增加了1.5倍,可在以下地址訪問http://ncg.kcl.ac.uk/。
圖:2372個癌癥候選基因來源(2個癌癥數(shù)據(jù)庫+273篇癌癥測序文章)。
數(shù)據(jù)庫使用體驗
基本信息模塊(各種NCBI序列編號與鏈接“一網(wǎng)打盡”)
癌癥基因信息模塊
1 Cancer information:提示BRCA1為腫瘤驅(qū)動基因的文獻列表(包括技術平臺,分析平臺,癌種等信息)
2 Duplicability(倍性):體現(xiàn)BRCA1基因編碼蛋白序列在基因組的比對情況
3 Orthology BRCA1基因的直系同源情況
4Network Properties:BRCA1蛋白互做情況
5Gene Expression in Normal Tissues:包括2個基因表達數(shù)據(jù)(GTEx和Protein Atlas)和1個蛋白表達數(shù)據(jù)(Protein Atlas)
6 Gene Expression in Cancer Cell Lines:列舉了三個數(shù)據(jù)庫中腫瘤細胞系中該基因表達情況(Cancer Cell Lines Encyclopedia (CCLE);Cosmic Cancer Cell Lines Project (CLP);Genentech dataset (GNE))
7 Essentiality:BRCA1基因?qū)τ诩毎荡婊畹谋仨毿裕▉碓从?span>OGEE和PICKLES 數(shù)據(jù)庫)
8 Protein Function:蛋白參與的通路信息(來源于KEGG,Reactome,BioCarta三個數(shù)據(jù)庫)
9 miRNA-gene interactions:互做miRNA信息
結語:如果準備開展一個腫瘤基因的功能研究,先來NCG數(shù)據(jù)逛一逛,一定可以少走很多彎路哦~