最近又有很多在線數(shù)據(jù)庫(kù)進(jìn)行了發(fā)布和更新,及時(shí)了解并巧妙運(yùn)用這些免費(fèi)的網(wǎng)上資源,會(huì)讓我們的研究事半功倍。今天小編就跟大家總結(jié)一下Nucleic Acids Research 10月以來(lái)最新發(fā)布和更新的一些數(shù)據(jù)庫(kù)信息。
DNA相關(guān):
1、CAGm:千人基因組計(jì)劃中germline微衛(wèi)星變異的數(shù)據(jù)庫(kù)
CAGm: a repository of germline microsatellite variations in the 1000 genomes project
網(wǎng)址:http://www.cagmdb.org/
Published:18 October 2018
人類基因組含有大量微衛(wèi)星(一類短串聯(lián)重復(fù)),被認(rèn)為是遺傳變異的重要來(lái)源,其長(zhǎng)度變異會(huì)影響基因表達(dá)等。但是,微衛(wèi)星變異往往受到測(cè)序深度和樣本量限制。本網(wǎng)站提供了千人基因組項(xiàng)目中2529個(gè)人germline微衛(wèi)星的比較分析(CAGm)。CAGm的一個(gè)關(guān)鍵創(chuàng)新之處是能夠按群體、種族(超級(jí)群體)和性別匯總微衛(wèi)星變異。該數(shù)據(jù)庫(kù)提供了對(duì)嵌入基因和功能元件中的微衛(wèi)星的高級(jí)搜索。所有數(shù)據(jù)都可以作為Microsoft Excel電子表格下載,并且是免費(fèi)的。
2、了解KEGG基因組變異的新方法
New approach for understanding genome variations in KEGG
網(wǎng)址:https://www.kegg.jp/和https://www.genome.jp/kegg/
Published:13 October 2018
KEGG(京都基因和基因組百科全書)是常用的分析生物基因組序列和其他高通量數(shù)據(jù)的參考知識(shí)庫(kù)。它是一個(gè)綜合性數(shù)據(jù)庫(kù),由基因組信息、化學(xué)信息,以及人類特有的健康信息這三類遺傳系統(tǒng)信息組成。KEGG路徑圖、BRITE層次結(jié)構(gòu)和KEGG模塊已經(jīng)被開發(fā)為具有功能性正交節(jié)點(diǎn)的通用分子網(wǎng)絡(luò)圖。但是這種通用方法不能很好代表健康信息類別,未考慮人類基因組的變異,特別是與疾病相關(guān)的變異。因此,在最近發(fā)布的KEGG網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中引入了一種新的方法,人類基因變異被明確地整合到稱之為“網(wǎng)絡(luò)變體”之中。這使得人們能夠積累有關(guān)疾病相關(guān)擾動(dòng)分子網(wǎng)絡(luò)的知識(shí),這些擾動(dòng)分子網(wǎng)絡(luò)不僅是由基因變異引起的,也可能由病毒和其他病原體、環(huán)境因素和藥物引起的。這將使KEGG數(shù)據(jù)庫(kù)將成為另一個(gè)參考知識(shí)庫(kù),用于疾病機(jī)制以及臨床測(cè)序和藥物開發(fā)中得到實(shí)際應(yīng)用。
3、CellMarker: 人類和老鼠細(xì)胞標(biāo)記的人工收集資源
CellMarker: a manually curated resource of cell markers in human and mouse
網(wǎng)址:http://biocc.hrbmu.edu.cn/CellMarker/和http://bio-bigdata.hrbmu.edu.cn/CellMarker/
Published:5 October 2018
生物學(xué)中最基本的問題之一是什么類型的細(xì)胞以功能協(xié)調(diào)的方式形成不同的組織和器官。更大規(guī)模的單細(xì)胞測(cè)序和生物學(xué)實(shí)驗(yàn)研究正在開辟解決這一問題的新途徑,揭示了用于區(qū)分組織中不同細(xì)胞類型的大量細(xì)胞標(biāo)記。CellMarker即為細(xì)胞標(biāo)記數(shù)據(jù)庫(kù),旨在為人類和小鼠組織中各種細(xì)胞類型提供全面、準(zhǔn)確的細(xì)胞標(biāo)記資源。通過手動(dòng)整理超過10萬(wàn)篇已發(fā)表的論文,記錄了4124條條目,包括細(xì)胞標(biāo)記信息、組織類型、細(xì)胞類型、癌癥信息和來(lái)源。最后,收集了158個(gè)人組織/亞組織中467種細(xì)胞類型的13605個(gè)細(xì)胞標(biāo)記,以及81個(gè)小鼠組織/亞組織中389種細(xì)胞類型的9148個(gè)細(xì)胞標(biāo)記。CellMarker提供了一個(gè)用戶友好的界面,用于瀏覽、搜索和下載不同組織的不同細(xì)胞類型的標(biāo)記。CellMarker是細(xì)胞研究的一個(gè)全面和有價(jià)值的資源,可以精確識(shí)別和表征細(xì)胞,特別是在單細(xì)胞水平。
4、CancerSEA:癌癥單細(xì)胞狀態(tài)圖譜
CancerSEA: a cancer single-cell state atlas
網(wǎng)址:http://biocc.hrbmu.edu.cn/CancerSEA/或http://202.97.205.69/CancerSEA/
Published:18 October 2018
癌細(xì)胞的高度功能異質(zhì)性是癌癥研究的一大挑戰(zhàn)。單細(xì)胞測(cè)序技術(shù)提供了一個(gè)前所未有的機(jī)會(huì),以單細(xì)胞分辨率破譯癌細(xì)胞的不同功能狀態(tài),癌癥scRNA-seq數(shù)據(jù)集已經(jīng)大量積累。這就迫切需要建立一種專用資源來(lái)解碼癌細(xì)胞的功能狀態(tài)。CancerSEA是第一個(gè)專門的數(shù)據(jù)庫(kù),旨在全面探索單細(xì)胞水平上癌細(xì)胞的不同功能狀態(tài)。CancerSEA描繪了癌癥單細(xì)胞功能狀態(tài)圖譜,涉及來(lái)自25種癌癥類型的41900個(gè)癌癥單細(xì)胞的14種功能狀態(tài)(包括干細(xì)胞、侵襲、轉(zhuǎn)移、增殖、EMT、血管生成、凋亡、細(xì)胞周期、分化、DNA損傷、DNA修復(fù)、缺氧、炎癥和終止)。它允許查詢哪些功能狀態(tài)與不同癌癥中感興趣的基因(或基因列表)相關(guān)聯(lián)。CancerSEA還提供了所有癌癥、特定癌癥和單個(gè)癌癥單細(xì)胞數(shù)據(jù)集中與功能狀態(tài)相關(guān)的PCG/lncRNA庫(kù)。CancerSEA提供了一個(gè)用戶友好的界面,用于全面搜索、瀏覽、可視化和下載成千上萬(wàn)個(gè)癌細(xì)胞的功能狀態(tài)和相應(yīng)的PCGs / lncRNAs表達(dá)信息。
5、CancerSplicingQTL: 人類全基因組鑒定癌癥剪接QTLs數(shù)據(jù)庫(kù)
CancerSplicingQTL: a database for genome-wide identification of splicing QTLs in human cancer
網(wǎng)址:http://www.cancersplicingqtl-hust.com/
Published:18 October 2018
在癌癥的發(fā)生、發(fā)展、預(yù)后和治療中經(jīng)常觀察到異常選擇性剪接(AS)模式。AS可能會(huì)受到基因變異的調(diào)節(jié)。剪接數(shù)量性狀基因座(sQTLs)是一種影響該事件的遺傳變異,它的鑒定可能是全面理解遺傳變異體在疾病發(fā)展中的貢獻(xiàn)的重要一步。利用來(lái)自癌癥基因組圖譜的基因型數(shù)據(jù)和TCGASpliceSeq計(jì)算的相應(yīng)AS值,研究者開發(fā)了一個(gè)計(jì)算管道,從33種癌癥類型的9026個(gè)腫瘤樣本中識(shí)別sQTLs,鑒定出所有癌癥類型的4599598 sQTLs。通過生存分析,確定了17072個(gè)與患者總生存時(shí)間相關(guān)的sQTLs。此外,使用全基因組關(guān)聯(lián)研究( GWAS )目錄數(shù)據(jù),發(fā)現(xiàn)了1180132個(gè)sQTLs與已知GWAS連鎖不平衡區(qū)域重疊。最終根據(jù)上述數(shù)據(jù)構(gòu)建了一個(gè)用戶友好的數(shù)據(jù)庫(kù)CancerSplicingQTL供用戶方便地瀏覽、搜索和下載感興趣的數(shù)據(jù)。這個(gè)數(shù)據(jù)庫(kù)提供了一個(gè)信息豐富的sQTL資源,用于進(jìn)一步描述控制人類癌癥轉(zhuǎn)錄異構(gòu)體的SNPs的潛在功能作用。
RNA相關(guān):
6、LncRNADisease 2.0:長(zhǎng)鏈非編碼RNA相關(guān)疾病更新數(shù)據(jù)庫(kù)
LncRNADisease 2.0: an updated database of long non-coding RNA-associated diseases
網(wǎng)址:http://www.rnanut.net/lncrnadisease/
Published:4 October 2018
越來(lái)越多的證據(jù)表明,長(zhǎng)鏈非編碼RNAs (lncRNAs)功能障礙與多種疾病有關(guān)。一個(gè)系統(tǒng)收集和治療lncRNA疾病關(guān)聯(lián)的知識(shí)庫(kù)對(duì)于進(jìn)一步研究潛在分子機(jī)制至關(guān)重要。2013年, LncRNADisease第一版發(fā)布,代表了收集實(shí)驗(yàn)支持的lncRNA疾病關(guān)聯(lián)的數(shù)據(jù)庫(kù)。這次研究者對(duì)該數(shù)據(jù)庫(kù)進(jìn)行了更新。LncRNADisease 2.0新功能包括: (i)與此前版本相比,lncRNA疾病關(guān)聯(lián)提高了40倍以上;(ii)提供lncRNA、mRNA和miRNA之間的轉(zhuǎn)錄調(diào)節(jié)關(guān)系;(iii)為每個(gè)疾病關(guān)聯(lián)lncRNA提供一個(gè)置信度得分;(iv)整合實(shí)驗(yàn)支持的circRNA疾病關(guān)聯(lián)。LncRNADisease 2.0記錄了20多萬(wàn)個(gè)疾病關(guān)聯(lián)lncRNA。這個(gè)數(shù)據(jù)庫(kù)將繼續(xù)作為與lncRNAs相關(guān)的潛在臨床應(yīng)用的寶貴來(lái)源。
7、RPFdb v2.0:核糖體印跡產(chǎn)生翻譯mRNA的全基因組信息更新數(shù)據(jù)庫(kù)
RPFdb v2.0: an updated database for genome-wide information of translated mRNA generated from ribosome profiling
網(wǎng)址:http://www.rpfdb.org或http://sysbio.sysu.edu.cn/rpfdb
Published:18 October 2018
RPFdb是一個(gè)用于托管、分析和可視化核糖體印跡測(cè)序(ribo-seq)數(shù)據(jù)的公共數(shù)據(jù)庫(kù)。研究者此次更新的版本RPFdb 2.0帶來(lái)了顯著的數(shù)據(jù)擴(kuò)展、特征改進(jìn)和功能優(yōu)化:(i) RPFdb 2.0目前托管著來(lái)自293項(xiàng)研究的2884個(gè)ribo-seq數(shù)據(jù)集,涵蓋29個(gè)不同物種;(ii)采用了具有多步質(zhì)量控制的精細(xì)分析管道,以改進(jìn)核糖序列數(shù)據(jù)的預(yù)處理和比對(duì);(iii)增加了新的功能模塊,為每個(gè)核糖序列數(shù)據(jù)提供主動(dòng)翻譯的開放閱讀框信息;(iv)提供了更多功能來(lái)提高數(shù)據(jù)庫(kù)的可用性。隨著這些添加和增強(qiáng),RPFdb 2.0將成為基因調(diào)控社區(qū)更有價(jià)值和更全面的數(shù)據(jù)庫(kù)。
8、EVmiRNA:胞外囊泡miRNA譜的數(shù)據(jù)庫(kù)
EVmiRNA: a database of miRNA profiling in extracellular vesicles
網(wǎng)址:http://bioinfo.life.hust.edu.cn/EVmiRNA
Published:18 October 2018
胞外囊泡(EVs),如外泌體和微泡,可以作為細(xì)胞間的交流載體和疾病潛在生物標(biāo)志物。miRNAs是EVs中研究最深入的分子,因此對(duì)EVs中miRNA表達(dá)譜的全面研究將有助于探索它們的功能和生物標(biāo)志物。研究者從17種來(lái)源/疾病中收集了462個(gè)EVs miRNA測(cè)序樣本,構(gòu)建了EVmiRNA數(shù)據(jù)庫(kù),以展示miRNA表達(dá)譜。研究者發(fā)現(xiàn)超過1000個(gè)miRNAs在這些EVs中表達(dá),并檢測(cè)到每種來(lái)源/疾病的EVs的特異性miRNAs。EVmiRNA提供三個(gè)功能模塊:(i)來(lái)自不同來(lái)源(如血液、母乳等)的EVs的miRNA表達(dá)譜和樣本信息。 (ii)在不同的EVs中特異性表達(dá)的miRNAs,這將有助于生物標(biāo)志物的鑒定;(iii) miRNA注釋,包括EVs和TCGA癌癥類型中的miRNA表達(dá)、miRNA調(diào)控途徑以及miRNA功能和文獻(xiàn)。EVmiRNA具有用戶友好的網(wǎng)頁(yè)界面,具有強(qiáng)大的瀏覽和搜索功能以及數(shù)據(jù)下載功能。這是第一個(gè)關(guān)注EVs中miRNA表達(dá)譜的數(shù)據(jù)庫(kù),將有助于EVs生物標(biāo)志物、miRNA功能和液體活組織檢查的研究和應(yīng)用。
9、LncBook: 人類長(zhǎng)鏈非編碼RNAs的精選知識(shí)庫(kù)
LncBook: a curated knowledgebase of human long non-coding RNAs
網(wǎng)址:http://bigd.big.ac.cn/lncbook
Published:17 October 2018
長(zhǎng)鏈非編碼RNAs(lncRNAs)在許多生物過程中具有重要的功能。盡管已知人類lncRNAs的數(shù)量急劇增加,但卻注釋不足。研究者提供了一個(gè)全面收集和通過多組學(xué)數(shù)據(jù)整合、功能注釋和疾病關(guān)聯(lián)的數(shù)據(jù)庫(kù)LncBook,它容納了大量270044個(gè)lncRNA,包括1867個(gè)具有3762個(gè)功能關(guān)聯(lián)的特征lncRNA。它還整合了大量來(lái)自表達(dá)、甲基化、基因組變異和lncRNA-miRNA相互作用的多組學(xué)數(shù)據(jù)。此外,LncBook整合了3772個(gè)實(shí)驗(yàn)驗(yàn)證的lncRNA疾病關(guān)聯(lián),并進(jìn)一步鑒定了總共97998個(gè)lncRNA,這些lncRNA被認(rèn)為與疾病相關(guān)。LncBook致力于人類lncRNAs及其相關(guān)數(shù)據(jù)的集成和管理,將成為全世界研究人員的寶貴知識(shí)庫(kù)。
表觀相關(guān):
10、EWASdb: 表觀組學(xué)范圍的關(guān)聯(lián)研究數(shù)據(jù)庫(kù)
EWASdb: epigenome-wide association study database
網(wǎng)址:http://www.ewas.org.cn/ewasdb和http://www.bioapp.org/ewasdb
Published:13 October 2018
DNA甲基化是目前研究最深入的表觀遺傳修飾,在理解疾病的分子機(jī)制方面發(fā)揮著重要作用。此外,表觀組范圍的關(guān)聯(lián)研究(EWAS)提供了一種系統(tǒng)的方法來(lái)識(shí)別常見疾病/表型背后的表觀遺傳變異。然而,沒有一個(gè)全面的數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)EWAS的結(jié)果。為了填補(bǔ)這個(gè)空白,人們開發(fā)出了EWASdb數(shù)據(jù)庫(kù),用于存儲(chǔ)EWAS DNA甲基化的表觀遺傳關(guān)聯(lián)結(jié)果,目前已經(jīng)儲(chǔ)存1319個(gè)與302種疾病/表型相關(guān)的EWAS。EWASdb數(shù)據(jù)庫(kù)有三種類型的EWAS結(jié)果:(i)單一標(biāo)記的EWAS;(ii)用于KEGG途徑的EWAS和(iii)用于GO (基因本體)類別的EWAS。迄今為止,來(lái)自43個(gè)國(guó)家的研究人員已經(jīng)搜索或下載了第一個(gè)全面的EWAS數(shù)據(jù)庫(kù)。EWASdb將成為一種寶貴的資源,對(duì)疾病/表型的表觀遺傳學(xué)研究做出重大貢獻(xiàn)。
11、NucMap:一個(gè)跨物種全基因組核小體定位圖數(shù)據(jù)庫(kù)
NucMap: a database of genome-wide nucleosome positioning map across species
網(wǎng)址:http://bigd.big.ac.cn/nucmap/
Published:18 October 2018
核小體定位動(dòng)力學(xué)影響染色質(zhì)狀態(tài)、轉(zhuǎn)錄和基因組DNA上發(fā)生的所有其他生物過程。雖然MNase-Seq在過去幾年中被用于描述真核生物中的核小體定位圖,但是核小體定位數(shù)據(jù)正在急劇增加。為了便于在研究中使用已發(fā)表的數(shù)據(jù),研究者開發(fā)了一個(gè)名為核小體定位圖的數(shù)據(jù)庫(kù)NucMap,它包括來(lái)自15個(gè)物種的477個(gè)樣本的798個(gè)MNase-Seq實(shí)驗(yàn)數(shù)據(jù)。通過一系列功能模塊,用戶可以搜索所有樣本中每個(gè)基因啟動(dòng)子區(qū)域核小體定位的概況,并對(duì)所有基因組區(qū)域的核小體定位數(shù)據(jù)進(jìn)行富集分析。構(gòu)建核小體瀏覽器來(lái)可視化核小體定位的輪廓。用戶還可以使用核小體瀏覽器可視化多種omics數(shù)據(jù)源,并進(jìn)行并排比較。數(shù)據(jù)庫(kù)中所有處理過的數(shù)據(jù)都是免費(fèi)提供的。NucMap是第一個(gè)全面的核小體定位平臺(tái),它將作為一個(gè)重要的資源來(lái)促進(jìn)對(duì)染色質(zhì)調(diào)節(jié)的理解。