通路富集分析有助于研究人員深入解析由組學(xué)(基因組、轉(zhuǎn)錄組、表觀組等)方法產(chǎn)生的基因列表數(shù)據(jù),這種方法可以鑒定出基因列表中富集的生物通路。最新發(fā)表的這篇Nature Protocols文章詳細(xì)解釋了通路富集分析的步驟,并提供了一種實(shí)用指南來(lái)更好的詮釋RNA-seq和基因組測(cè)序等實(shí)驗(yàn)產(chǎn)生的基因列表數(shù)據(jù)。該方案包括三個(gè)主要步驟:從組學(xué)數(shù)據(jù)中定義基因列表,確定統(tǒng)計(jì)學(xué)上富集的通路,以及結(jié)果的可視化及解釋。具體應(yīng)用到g:Profiler、GSEA、Cytoscape和EnrichmentMap四種工具。該方案為沒(méi)有生物信息學(xué)經(jīng)驗(yàn)的生物學(xué)家設(shè)計(jì),可以在大約4.5小時(shí)內(nèi)完成分析。
本文推薦四種工具完成富集通路分析,因?yàn)樗鼈儍H靠鼠標(biāo)點(diǎn)擊(point-and-click)即可完成分析,無(wú)需編程背景,易于上手。另外它們均可免費(fèi)下載,能夠完成高級(jí)功能分析,具有大量文檔說(shuō)明和最新更新數(shù)據(jù)庫(kù)支持等。
● g:Profiler (https://biit.cs.ut.ee/gprofiler/)
● GSEA (http://software.broadinstitute.org/gsea/)
● Cytoscape (http://www.cytoscape.org/)
● EnrichmentMap (http://www.baderlab.org/Software/EnrichmentMap)
圖1、方案概述
來(lái)自不同組學(xué)數(shù)據(jù)的基因列表通過(guò)使用g:Profiler或GSEA進(jìn)行通路富集分析,鑒定實(shí)驗(yàn)中富集的通路。在Cytoscape中使用EnrichmentMap, AutoAnnotate, WordCloud和clusterMaker2命令,對(duì)富集結(jié)果進(jìn)行可視化和解釋。
o 名詞解釋(Box1)
步驟1、利用組學(xué)數(shù)據(jù)定義感興趣的基因列表
組學(xué)數(shù)據(jù)定義基因列表有兩種主要方式:基因列表(gene list)或排序基因列表(ranked gene list)(圖1)。某些組學(xué)數(shù)據(jù)會(huì)產(chǎn)生一個(gè)基因列表,例如通過(guò)外顯子測(cè)序鑒定腫瘤中的所有體細(xì)胞突變基因等,這樣的列表適合于使用g:Profiler直接輸入通路富集分析。其他組學(xué)數(shù)據(jù)會(huì)產(chǎn)生排序基因列表。例如RNA-seq獲得的差異基因表達(dá)表格等,可以使用GSEA工具進(jìn)行分析。
步驟2A、使用g:Profiler進(jìn)行基因列表的通路富集分析 (圖2,詳細(xì)步驟參見(jiàn)原文)
圖2、g:Profiler界面展示
步驟2B、使用GSEA進(jìn)行排序基因列表的通路富集分析 (圖3-4,詳細(xì)步驟參見(jiàn)原文)
圖3、GSEA界面展示
圖4、GSEA輸出舉例
a、GSEA結(jié)果的網(wǎng)頁(yè)摘要,顯示了在排序列表的頂部或底部富集的途徑,其中“na_pos”和“na_neg”表型分別對(duì)應(yīng)于上調(diào)和下調(diào)基因的富集。b、Mesenchymal中通路富集圖。c、Immunoreactive中通路富集圖。
o 通路富集分析數(shù)據(jù)庫(kù)資源(Box2)
o 多重檢驗(yàn)校正詳解(Box3)
o 通路富集分析中的統(tǒng)計(jì)檢驗(yàn)解釋(Box4)
步驟3、通路富集分析結(jié)果可視化及解釋 (圖5-8,詳細(xì)步驟參見(jiàn)原文)
結(jié)果的可視化由EnrichmentMap軟件完成。
圖5、EnrichmentMap軟件用戶界面
圖6、通路富集圖結(jié)果展示
圖7、EnrichmentMap熱圖結(jié)果舉例
圖8、可用于文章發(fā)表的富集結(jié)果展示
本文除了對(duì)組學(xué)數(shù)據(jù)的通路富集分析及可視化做了詳盡說(shuō)明外,還對(duì)實(shí)驗(yàn)設(shè)計(jì)、重復(fù)次數(shù)、參數(shù)和極端值的處理、通路基因集數(shù)據(jù)庫(kù)的選擇、其他軟件方法的比較,以及常見(jiàn)問(wèn)題等都做了說(shuō)明,值得拿來(lái)慢慢品味。
原文網(wǎng)址:http://dx.doi.org/10.1038/s41596-018-0103-9
關(guān)于天昊
天昊生物具有多年基因組、轉(zhuǎn)錄組和表觀組檢測(cè)與分析經(jīng)驗(yàn),可以為用戶提供多層次、全方位、一站式專業(yè)服務(wù),期待成為您多組學(xué)測(cè)序分析的優(yōu)質(zhì)服務(wù)提供商!