目標(biāo)區(qū)域測序在動植物研究中的應(yīng)用
發(fā)稿時間:2016-06-20來源:天昊生物
關(guān)于目標(biāo)區(qū)域測序
目標(biāo)區(qū)域測序(Targeted
Sequencing):是目標(biāo)區(qū)域測序是指針對感興趣的目標(biāo)區(qū)域富集后進(jìn)行大規(guī)模測序。研究者可以針對自己感興趣的染色體區(qū)域或者大量的候選基因區(qū)域進(jìn)行數(shù)百個甚至上千個樣品的序列測定。
目標(biāo)區(qū)域測序優(yōu)勢
針對性強(qiáng):比起全基因組水平的研究,目標(biāo)區(qū)域測序更具有針對性,可以依賴大量的前期研究成果,獲得候選染色體區(qū)域或者基于生物通路的大量候選基因。
費(fèi)用低:目標(biāo)區(qū)域測序區(qū)域較小,可對數(shù)百個樣品進(jìn)行快速測序,大大降低了研究成本。
信息量大:比起目標(biāo)區(qū)域或者候選基因單倍型標(biāo)簽SNP分型的研究策略,目標(biāo)區(qū)域測序可以完整覆蓋整個基因區(qū)域,不僅可以獲得高頻SNP的分型數(shù)據(jù),而且還可以發(fā)現(xiàn)低頻的和個體特有的變異。
效率高:比起使用Sanger法的候選基因測序方法,基于二代測序技術(shù)的目標(biāo)區(qū)域測序更加快速、高效!
高精度:目標(biāo)區(qū)域的高測序深度保證了更準(zhǔn)確的測序結(jié)果,例如目標(biāo)區(qū)域測序的測序深度可以達(dá)到200×。
目標(biāo)區(qū)域測序在動植物研究中的應(yīng)用
1.有些物種是異源四倍體物種 ,對于這種異源四倍體物種其一個基因特定位點(diǎn)最多有四種不同的等位基因,因此要準(zhǔn)確區(qū)別不同的等位基因和準(zhǔn)確確定等位基因的拷貝數(shù)在測序時相對于二倍體就需要更高的測序深度,其測序深度至少要達(dá)到48×,此時目的目的區(qū)域測序就顯示出其無可比擬的優(yōu)勢。通過對這些異源多倍體物種的目標(biāo)區(qū)域進(jìn)行富集捕獲測序,數(shù)據(jù)可用于群體結(jié)構(gòu)以及GWAS-QTL分析。
相應(yīng)研究案例:
對83株四倍體栽培土豆和1株參照二倍體土豆,平均分布在基因組上807個基因,共2.1M的區(qū)間進(jìn)行富集,測序后獲得平均覆蓋深度為63×,共12.4G的高質(zhì)量數(shù)據(jù),發(fā)現(xiàn)129,156個可靠的序列變異(在外顯子1
SNP/24 bp ,在內(nèi)含子1 SNP/15 bp),這些變異含有大量罕見變異(61%的變異MAF小于
0.05),經(jīng)KASP技術(shù)驗(yàn)證有99%的一致性。利用發(fā)現(xiàn)的變異對土豆植株成熟期和塊莖肉色相關(guān)的QTL進(jìn)行GWAS分析,定位到了之前的已知QTL位點(diǎn)。主成分分析發(fā)現(xiàn)栽培土豆可以明顯聚類為五組。
圖1.
DNA序列變異與土豆的兩種性狀:(A)植株成熟期和(B)塊莖顏色相關(guān)性p值的Manhattan圖
參考文獻(xiàn):A
Next-Generation Sequencing Method for Genotyping-by-Sequencing of Highly
Heterozygous Autotetraploid Potato. Jan G. A. M. L. Uitdewilligen
et al. 2013, PloS ONE.
2.針對某些物種間的保守區(qū)域進(jìn)行目標(biāo)區(qū)域測序,利用測序數(shù)據(jù)進(jìn)行物種分類和系統(tǒng)進(jìn)化分析,這種策略類似于利用16S rDNA/18S
rDNA/ITS擴(kuò)增子測序進(jìn)行微生物群落多樣性分析或利用DNA條形碼技術(shù)進(jìn)行品種資源鑒定和系統(tǒng)進(jìn)化分析。
相應(yīng)研究案例:
不同鳥類的演化仍然有爭議,利用雜交富集的定向測序技術(shù),對198種現(xiàn)存鳥類(代表所有鳥類譜系和兩個鱷魚外群)的394個有足夠變異度的保守位點(diǎn)進(jìn)行目標(biāo)區(qū)域測序(Agilent定制液相芯片富集),然后基于測序數(shù)據(jù)使用貝葉斯法和最大似然分析法建立所有鳥類譜系的系統(tǒng)進(jìn)化樹。產(chǎn)生259個高質(zhì)量測序核位點(diǎn)(平均組裝長度為1523bp)共7.8
× 10
7 個堿基的數(shù)據(jù)量,基于這些數(shù)據(jù)使用貝葉斯法和最大似然分析法建立所有鳥類譜系的進(jìn)化樹,5個主要分支形成新鳥綱的連續(xù)姐妹類群:(1)包括夜鷹,雨燕和蜂鳥;(2)包括杜鵑,大鴇,鴿子,蕉鵑和沙雞;(3)
鶴及其親屬;(4)水鳥類群,包括潛水類、涉水類、岸灘類;(5)麝雉類(圖1)。
圖1. 鳥類的系統(tǒng)發(fā)育樹
參考文獻(xiàn):A
comprehensive phylogeny of birds (Aves) using targeted next-generation DNA
sequencing. Richard O. Prum
et al. 2015, Nature.
3.為了保護(hù)種質(zhì)資源,開發(fā)可靠的并且高度可變的遺傳標(biāo)記是必不可少的,對于一些基因組復(fù)雜但是遺傳標(biāo)記比較缺少的物種,過去常使用細(xì)胞器基因組進(jìn)行相關(guān)系統(tǒng)進(jìn)化研究,但是這種方法具有效率低和單親遺傳等缺點(diǎn),因此目前高通量測序非常適合這種非模式物種的遺傳標(biāo)記開發(fā)研究,但是使用全基因組重測序?qū)@類基因組復(fù)雜物種進(jìn)行群體進(jìn)化研究實(shí)際上是代價高昂的,而目標(biāo)區(qū)域測序這種只針對某些可靠位點(diǎn)進(jìn)行深度測序的技術(shù)實(shí)際上更符合成本效益。
相應(yīng)研究案例:
根據(jù)白皮松轉(zhuǎn)錄組序列設(shè)計(jì)捕獲探針,從而對48棵白皮松(每棵白皮松代表不同地理位置)上的7,849個不同基因進(jìn)行目標(biāo)區(qū)域捕獲測序,從這48棵白皮松樣本中共得到
390,910,265條 reads,所得到的數(shù)據(jù)提供了4452個基因的基因信息,共鑒定到12390個多態(tài)性位點(diǎn)(其中2163個變異位點(diǎn)的MAF >
0.1),然后通過這些位點(diǎn)揭示了雜合度和等位基因豐度的地理分布趨勢,
PCA分析結(jié)果與這48棵白皮松的實(shí)際地理分布是一致的,并且指出南部樹木相對于其它區(qū)域的樹木顯示出最大的差異分化。
圖1.
與雜合性,緯度和經(jīng)度相關(guān)的主成分(PC)。樣品的顏色按地理分布,(a)PC1與雜合度。(b)PC2與緯度。(C)PC3與緯度。(d)PC4與經(jīng)度
參考文獻(xiàn):Targeted Capture Sequencing in Whitebark Pine
Reveals Range-Wide Demographic and Adaptive Patterns Despite Challenges of a
Large, Repetitive Genome.Syring JV
et al. 2016,Front Plant
Sci.
其它應(yīng)用展望
4.
傳統(tǒng)方法QTL性狀粗定位鎖定大致區(qū)域后,如果區(qū)域內(nèi)沒有足夠多的分子標(biāo)記或者沒有合適的分子標(biāo)記,可使用目標(biāo)區(qū)域測序來開發(fā)分子標(biāo)記從而進(jìn)行下一步的精細(xì)定位,如果精細(xì)定位鎖定區(qū)域大小在目標(biāo)區(qū)域測序大小范圍內(nèi)可以使用目標(biāo)區(qū)域測序直接鎖定QTL關(guān)聯(lián)位點(diǎn)或基因。
5.
混池分組分析法(BSA)已經(jīng)廣泛應(yīng)用于動植物QTL定位的研究中,并且發(fā)現(xiàn)了QTL候選區(qū)域,因此后續(xù)可以對候選區(qū)間進(jìn)行目標(biāo)區(qū)域測序,獲得區(qū)域內(nèi)SNP/InDel的多態(tài)信息,聯(lián)合性狀進(jìn)行關(guān)聯(lián)或者連鎖分析,從而鎖定QTL關(guān)聯(lián)位點(diǎn)/基因。
6. 全基因組關(guān)聯(lián)分析(GWAS)己經(jīng)廣泛地應(yīng)用于QTL性狀的研究當(dāng)中,并且定位出了大量顯著的SNP位點(diǎn),然而這些標(biāo)記位點(diǎn)大部分為常見變異位點(diǎn),因此可以通過對
GWAS
鑒定的區(qū)域進(jìn)行目標(biāo)區(qū)域測序,從而找到與QTL性狀緊密相關(guān)的其它新的、稀有的和可能的功能變異。
目標(biāo)區(qū)域測序在動植物研究中的應(yīng)用總結(jié)
天昊生物目標(biāo)區(qū)域測序整體解決方案
天昊生物目標(biāo)區(qū)域測序特色
-
實(shí)驗(yàn)技術(shù)方法靈活:多種策略可供選擇,適合各種規(guī)模的目標(biāo)區(qū)域二代測序項(xiàng)目。
-
極具特色的實(shí)驗(yàn)質(zhì)控體系:利用SNaPshot多重SNP分型技術(shù)對目標(biāo)區(qū)域內(nèi)的12-16個高頻SNP位點(diǎn)進(jìn)行SNP分型質(zhì)控,判斷測序數(shù)據(jù)和樣品標(biāo)記的準(zhǔn)確性。
-
經(jīng)驗(yàn)豐富的生物信息學(xué)和遺傳學(xué)分析團(tuán)隊(duì):結(jié)合多年豐富的遺傳分析經(jīng)驗(yàn),開發(fā)了一套理論基礎(chǔ)扎實(shí)、實(shí)用性強(qiáng)的二代測序數(shù)據(jù)分析體系,為研究者更好的判斷和分析二代測序的結(jié)果提供了指導(dǎo)性的幫助。
天昊目標(biāo)區(qū)域測序技術(shù)發(fā)表高分文章
-
Whole-exome and targeted sequencing identify ROBO1 and ROBO2 mutations as progression-related drivers inmyelodysplastic syndromes.
Feng Xu,et al. Nature communication. 2015, 26;6:8806.(IF=
11.47)(應(yīng)用天昊創(chuàng)新技術(shù):FastTargetTM)
-
Genomic variations of the mevalonate pathway in porokeratosis.
Zhang Z,et al. Elife. 2015,23;4:e06322.(IF=
9.322)(應(yīng)用天昊創(chuàng)新技術(shù):EasyTarget?)
-
Mutations in epigenetic regulators are involved in acute
lymphoblastic leukemia relapse following allogeneic hematopoietic cell
transplantation. Xiao, H,et al.Oncotarget.2016,19;7(3):2696-708. (IF=
6.359)(應(yīng)用天昊創(chuàng)新技術(shù):FastTargetTM)
FastTargetTM項(xiàng)目實(shí)例:
項(xiàng)目簡介:利用FastTarget
TM富集技術(shù)對32個基因(約140K區(qū)域)350個樣本進(jìn)行測序。
數(shù)據(jù)量統(tǒng)計(jì):共測序得到37M的reads,有效34M的reads,富集效率92%,平均每個片段覆蓋173X。
分析結(jié)果:在32個基因350個樣本中共發(fā)現(xiàn)了184個突變。
數(shù)據(jù)結(jié)果驗(yàn)證:采用SNaPshot對目標(biāo)區(qū)域內(nèi)12個高頻SNP位點(diǎn)對所有樣本進(jìn)行了分析,觀察基因型的一致性,除了少部分樣本因?yàn)闇y序深度不夠,其它基本上達(dá)到了100%的一致性。
EasyTarget?項(xiàng)目實(shí)例
項(xiàng)目簡介:采用EasyTarget
?富集方法對
9個基因(約37K區(qū)域)133個樣本進(jìn)行測序。
數(shù)據(jù)量統(tǒng)計(jì):總數(shù)據(jù)量為11M
reads,有效reads為9.6M,富集效率87%,平均每個樣本72K reads,平均每個片段覆蓋486X,樣本測序深度分布如下。
分析結(jié)果:在9個基因133個樣本中共發(fā)現(xiàn)55個突變。
數(shù)據(jù)結(jié)果驗(yàn)證:全部通過一代Sanger測序驗(yàn)證,100%的準(zhǔn)確性。