国产乱人伦精品视频免费_一级毛片a一级毛片一级毛片_国产激情电影在线观看_玖玖国产精品第一页_无码中文字幕国内媒体_乱伦自拍影视三级_无遮挡很黄很色很湿的视频_日韩欧美电影免费观看_日韩欧美在线不卡_精品国产成人人网站一区二区


  • 免費(fèi)服務(wù)熱線
  • 400-065-6886
  • 電話:86(0)512-6295 9990
  • 傳真:86(0)512-6295 9995
新聞中心

Nature Methods最新文章:單細(xì)胞RNA-seq數(shù)據(jù)關(guān)鍵性t-SNE分析改進(jìn)

發(fā)稿時(shí)間:2019-02-20來源:天昊生物


t-分布隨機(jī)鄰域嵌入(t-distributed stochastic neighbor embedding, t-SNE)廣泛用于單細(xì)胞RNA測序(scRNA-seq)數(shù)據(jù)可視化分析,但是它很難擴(kuò)展到大型數(shù)據(jù)集。2019年2月11日發(fā)表在Nature Methods的最新文章,推出了一種基于快速插值t-SNE的單細(xì)胞RNA-seq數(shù)據(jù)分析方法,該方法極大地加快了t-SNE的分析速度,消除了數(shù)據(jù)向下采樣(downsampling)的要求,更易對(duì)稀有細(xì)胞群體進(jìn)行可視化。此外,本研究基于一維t-SNE實(shí)現(xiàn)了scRNA-seq熱圖的可視化,以便同時(shí)對(duì)成千上萬個(gè)基因的表達(dá)模式進(jìn)行可視化。

軟件下載網(wǎng)址:https://github.com/KlugerLab/FIt-SNE或

https://github.com/KlugerLab/t-SNE-Heatmaps



什么是t-SNE:即t-分布隨機(jī)鄰域嵌入算法,是目前一個(gè)非常流行的對(duì)高維度數(shù)據(jù)進(jìn)行降維的算法, 具體說來就是把數(shù)據(jù)集中數(shù)據(jù)之間的高維歐式距離轉(zhuǎn)變了條件概率來表示數(shù)據(jù)之間的相似度,由Laurens van der Maaten和 Geoffrey Hinton于2008年提出(原文鏈接:http://jmlr.csail.mit.edu/papers/volume9/vandermaaten08a/vandermaaten08a.pdf),它可以有效的將高維度數(shù)據(jù)轉(zhuǎn)換成二維圖像,目前已成為單細(xì)胞RNA測序(scRNA-seq)數(shù)據(jù)可視化最常用的一種分析內(nèi)容。


scRNA-seq可以在單細(xì)胞水平進(jìn)行高通量轉(zhuǎn)錄組分析,并越來越多地應(yīng)用于研究生理和疾病過程中細(xì)胞間的異質(zhì)性問題。scRNA-seq數(shù)據(jù)的可視化,對(duì)于分析已知細(xì)胞群體中不同標(biāo)記基因的表達(dá)和識(shí)別新細(xì)胞類型方面發(fā)揮了關(guān)鍵作用。在過去十年中,使用t-SNE的數(shù)據(jù)可視化已經(jīng)成為scRNA-seq分析的基石。t-SNE用于將scRNA-seq數(shù)據(jù)集嵌入到低維空間中,使得單細(xì)胞數(shù)據(jù)的高維轉(zhuǎn)錄組空間與低維空間中保持一致。嵌入通常由感興趣基因的表達(dá)水平來決定并進(jìn)行顏色標(biāo)注,一次對(duì)一個(gè)基因進(jìn)行分析。


目前t-SNE應(yīng)用于scRNA-seq數(shù)據(jù)分析存在的問題

由于scRNA-seq實(shí)驗(yàn)技術(shù)的快速發(fā)展,需要分析的細(xì)胞數(shù)量呈指數(shù)增長。最近的研究檢測數(shù)據(jù)集已經(jīng)超過了100萬個(gè)細(xì)胞中的30000個(gè)基因的表達(dá)。對(duì)如此大量的細(xì)胞進(jìn)行分析有助于對(duì)較小樣本中不明顯的罕見和中等大小的亞群進(jìn)行表征。然而,用于構(gòu)建t-SNE嵌入的現(xiàn)有算法在計(jì)算上是成本很高的,通常需要在t-SNE之前對(duì)細(xì)胞進(jìn)行向下采樣來降低計(jì)算量,但這又會(huì)導(dǎo)致錯(cuò)過罕見的細(xì)胞群體。此外,去除可能表達(dá)給定標(biāo)記基因的少數(shù)細(xì)胞可能會(huì)使中等大小的群體難以識(shí)別。

將t-SNE應(yīng)用于scRNA-seq數(shù)據(jù)的另一個(gè)困難是,由于每個(gè)數(shù)據(jù)集有大量的標(biāo)記基因,將標(biāo)記基因的表達(dá)水平疊加在單獨(dú)的二維(2D) t-SNE圖上很麻煩。實(shí)際上,只有少量這樣的圖可以在視覺上進(jìn)行比較。


本研究對(duì)t-SNE的改進(jìn)

本文對(duì)t-SNE在scRNA-seq數(shù)據(jù)可視化中的應(yīng)用提出了兩點(diǎn)改進(jìn)。首先,研究者提出了基于快速傅立葉變換(FFT)加速插值的t-SNE (FIt-SNE),這是一種基于多項(xiàng)式插值的一維(1D)和二維t-SNE快速計(jì)算算法,并使用FFT進(jìn)一步加速。本研究還展示了t-SNE熱圖,這是一種基于1D t-SNE的熱圖可視化方法,它同時(shí)可視化成百上千個(gè)基因的表達(dá)模式。

研究者使用FIt-SNE嵌入了一個(gè)由130萬個(gè)小鼠腦細(xì)胞組成的數(shù)據(jù)集,并從Allen Brain Atlas中成功識(shí)別出兩種已知的細(xì)胞類型,而這兩種細(xì)胞類型無法使用50000個(gè)細(xì)胞的隨機(jī)子集來識(shí)別(圖1),因?yàn)樵撟蛹瘺]有足夠的細(xì)胞同時(shí)表達(dá)SncgSlc18a8兩種標(biāo)記。


圖1、通過標(biāo)記基因識(shí)別大數(shù)據(jù)集中的亞群。a)使用FIt-SNE分析130萬小鼠腦細(xì)胞的完整數(shù)據(jù)集。b)向下采樣到隨機(jī)的50000個(gè)細(xì)胞結(jié)果。



使用t-SNE探索scRNA-seq數(shù)據(jù),每個(gè)圖都被不同標(biāo)記基因的表達(dá)模式所著色。人們通常最感興趣的是哪些基因與哪些簇相關(guān)聯(lián),而不是簇的形狀或相對(duì)位置。已有研究表明,t-SNE保留了良好聚類數(shù)據(jù)的聚類結(jié)構(gòu),而與嵌入維度無關(guān),因此一維t-SNE1D t-SNE)通常包含與二維t-SNE2D t-SNE)相同的信息。因此本研究者開發(fā)了一種相關(guān)的方法,利用單個(gè)一維嵌入的緊湊性,以熱圖形式來探索成百上千個(gè)基因的表達(dá)模式。這種方法還可以發(fā)現(xiàn)新的標(biāo)記基因,并根據(jù)它們沿著細(xì)胞的一維t-SNE平滑表達(dá)模式來組織基因。用戶可以根據(jù)熱圖中數(shù)據(jù)集的聚類結(jié)構(gòu),來放大并識(shí)別表征和區(qū)分嵌入不同區(qū)域的基因(圖2)。


圖2、t-SNE熱圖的示意圖。a, b)從表達(dá)矩陣開始,計(jì)算1D t-SNE,轉(zhuǎn)換為由每個(gè)基因的表達(dá)著色的水平軸。c)將1D t-SNE進(jìn)行bin處理,通過每個(gè)bin中每個(gè)基因的平均表達(dá)來表示每個(gè)基因。d)生成vector的熱圖,從而將t-SNE中具有相似表達(dá)模式的基因分組在一起。e)利用已報(bào)告視網(wǎng)膜雙極細(xì)胞數(shù)據(jù)展示t-SNE熱圖效果圖。




關(guān)于天昊

天昊生物具有多年基因組、轉(zhuǎn)錄組和表觀組檢測與分析經(jīng)驗(yàn),現(xiàn)推出的10x單細(xì)胞轉(zhuǎn)錄組測序可為您提供專業(yè)便捷的科研服務(wù)及個(gè)性化的單細(xì)胞信息挖掘,期待成為您單細(xì)胞測序分析的優(yōu)質(zhì)服務(wù)提供商!

歡迎聯(lián)系我們具體咨詢!

郵箱:[email protected] 

電話:400-065-6886


Copyright ? 2012-2023 天昊基因科技(蘇州)有限公司    All Rights Reserved    蘇ICP備17064027號(hào)-1