摘要:水稻品種分析最新研究進(jìn)展
水稻是世界上最重要的農(nóng)作物之一,約為世界一半人口的主食。野生稻作為一個(gè)巨大基因庫,在水稻品種改良過程中起到重要作用。如何準(zhǔn)確、快速地鑒定這些品種,便成為有效利用野生稻種質(zhì)資源的關(guān)鍵。在本研究中,研究人員通過比較水稻葉綠體基因組進(jìn)行品種鑒定,開發(fā)出具有應(yīng)用價(jià)值的葉綠體分子標(biāo)記。本研究利用Illumina HiSeq平臺(tái),對(duì)4個(gè)水稻品種葉綠體基因組進(jìn)行測(cè)序,并從GenBank數(shù)據(jù)庫中獲得另外14種水稻葉綠體基因組序列,之后進(jìn)行比較分析。研究對(duì)18種水稻葉綠體基因組中的SSR類型及分布進(jìn)行了統(tǒng)計(jì),并且發(fā)現(xiàn)有5個(gè)可變區(qū)(rps16-trnQ,trnTEYD,psbE-petL,rpoC2和rbcL-accD)可以作為DNA條形碼進(jìn)行檢測(cè),單個(gè)基因最高檢測(cè)的分辨率可達(dá)到72.22%,是通過rpoC2和rbcL-accD的基于距離方法得到的,而通過rps16-trnQ+trnTEYD+rbcL-accD, rps16-trnQ+trnTEYD+rpoC2和 rpoC2+trnTEYD+psbE-petL這三種標(biāo)記組合則可達(dá)到100%的品種分辨率。通過比較品種間葉綠體基因組序列,從中鑒定出最易變的區(qū)域,并評(píng)估分歧焦點(diǎn)區(qū)域,是開發(fā)物種特異性DNA條形碼的有效方法?;趯?duì)水稻葉綠體基因組資源的評(píng)價(jià),研究人員認(rèn)為利用葉綠體基因組序列開發(fā)分子標(biāo)記來鑒定用于水稻改良的野生稻遺傳資源是可靠和有用的。
發(fā)表時(shí)間:2017年10月 發(fā)表期刊:Frontiers in Plant Science 影響因子:4.3
研究背景:
1、野生稻蘊(yùn)藏著寶貴的遺傳多樣性資源,對(duì)水稻作物的改良具有巨大作用。野生稻的分類仍然存在問題。例如,A-genome分組中包含了8個(gè)二倍體品種,它們大多缺乏明確的形態(tài)學(xué)特征。
2、DNA條形碼技術(shù)可以提供一種新的用于準(zhǔn)確鑒定物種的方法。常用的植物DNA條形碼包括葉綠體基因rbcL和matK或ycf1b和核基因ITS等。但是作為水稻系統(tǒng)發(fā)生研究,目前仍無十分有效的DNA條形碼可以用。
研究內(nèi)容:
葉綠體基因組測(cè)序、SSR及DNA條形碼分析。
具體方法:
1、提取植物基因組總DNA,超聲獲得400-600 bp片段,利用NEBNext? UltraTM DNA建庫試劑盒構(gòu)建測(cè)序文庫,Illumina HiSeq測(cè)序平臺(tái)進(jìn)行雙末端測(cè)序(2 x 150 bp)。
2、利用SPAdes 3.6.1軟件對(duì)測(cè)得的reads進(jìn)行定性評(píng)估和組裝,BLAST比對(duì)所用的水稻葉綠體參考序列GenBank登錄號(hào)為JN861110。用Sequencher 5.4.5 軟件對(duì)得到的contigs進(jìn)行葉綠體基因組組裝。對(duì)剩余的gap設(shè)計(jì)引物進(jìn)行一代補(bǔ)充測(cè)序,最終獲得完整葉綠體基因組序列。利用Plann軟件對(duì)葉綠體基因組進(jìn)行注釋,并用Genome Vx軟件繪制葉綠體基因組圖譜。
3、利用MIcroSAtellite (MISA)在葉綠體基因組中尋找SSR,.參數(shù)標(biāo)準(zhǔn)為單核苷酸重復(fù)>10,二核苷酸重復(fù)>5,三核苷酸重復(fù)>4,四、五、六核苷酸重復(fù)>3?;诨匚慕Y(jié)構(gòu),利用網(wǎng)絡(luò)REPuter軟件進(jìn)行分散重復(fù)序列開發(fā)。
4、利用葉綠體基因組對(duì)18種稻屬植物的平均成對(duì)序列差異進(jìn)行分析。所有水稻葉綠體基因組的比對(duì)用MAFFT v7軟件進(jìn)行,假設(shè)共線性基因組完全一致,然后使用Se-Al 2.0軟件手動(dòng)調(diào)整。利用MEGA 6軟件計(jì)算變異和簡化的堿基位點(diǎn),并且通過計(jì)算水稻葉綠體基因組的p-距離來估計(jì)水稻品種的分化程度。
利用全葉綠體基因組序列數(shù)據(jù),采用最大簡約法(MP)、最大似然法(ML)和貝葉斯推理法(BI)構(gòu)建系統(tǒng)樹。MP分析使用PAUP v4b10軟件進(jìn)行,利用啟發(fā)搜索的“MulTrees”選項(xiàng),以及樹平分重聯(lián)分支交換方法。為了評(píng)估節(jié)點(diǎn)支持度,進(jìn)行帶有10個(gè)隨機(jī)分類和啟發(fā)搜索的1000次重復(fù)自舉分析。對(duì)所有堿基進(jìn)行權(quán)重分析,gaps標(biāo)記為缺失,其字符狀態(tài)視為無序。ML分析采用RAxML v.8.1.24軟件,選擇一般時(shí)間可逆(GTR)及G模型。對(duì)節(jié)點(diǎn)的支持度用1000次快速自舉重復(fù)進(jìn)行評(píng)估。BI分析使用Mrbayes v3.2軟件,通過進(jìn)行1000000代計(jì)算及每1000代取樣一次方法進(jìn)行分析,先丟棄構(gòu)建的前25%的樹作為預(yù)實(shí)驗(yàn)數(shù)據(jù),對(duì)剩下的數(shù)據(jù)構(gòu)建50%多數(shù)規(guī)則一致性的樹,估計(jì)貝葉斯后驗(yàn)概率。
5、分歧熱點(diǎn)識(shí)別使用SPIDER軟件的slideAnalyses函數(shù)命令,對(duì)葉綠體基因組高變區(qū)進(jìn)行鑒定。這個(gè)函數(shù)提取所有選定窗口大小的比對(duì)DNA序列,并對(duì)每個(gè)窗口進(jìn)行兩兩距離(K2P)分析。對(duì)高變區(qū)的識(shí)別需要考慮兩個(gè)因素:第一是每個(gè)窗口平均距離;第二是矩陣中每個(gè)物種零成對(duì)距離的比例。
6、本研究對(duì)高變區(qū)條形碼進(jìn)行了分析,用兩種方法比較了葉綠體rbcL、matK和trnH-psbA。為了評(píng)估條形碼分辨率,其距離和建樹采用不同分析方法。距離采用條形碼分析最常見的DNA序列分類方法,利用SPIDER軟件的nearNeighbour函數(shù)進(jìn)行。建樹分析可以提供了一種方便、直觀的方法,通過計(jì)算單種群物種的比例來評(píng)價(jià)差異的表現(xiàn)。利用MEGA 6.0軟件,對(duì)每個(gè)高變區(qū)marker及不同的marker組合進(jìn)行MP樹構(gòu)建,通過1000次自舉重復(fù)對(duì)分支相對(duì)支持度進(jìn)行評(píng)估,當(dāng)所有種內(nèi)個(gè)體形成單一排它分支時(shí),即被認(rèn)定為一個(gè)物種。
研究結(jié)果:
1、水稻葉綠體基因組測(cè)序及注釋
14種水稻Genbank數(shù)據(jù)如表1所示。表2為本研究進(jìn)行的4種水稻葉綠體基因組測(cè)序數(shù)據(jù)結(jié)果,可見測(cè)序深度達(dá)到117x – 556x,注釋可見這些葉綠體基因組表現(xiàn)出經(jīng)典的四部分結(jié)構(gòu),包括成對(duì)IRs區(qū)、LSC區(qū)和SSC區(qū)。所有4種水稻葉綠體基因組平均GC含量為39.0%,包含的基因數(shù)量、排布順序和名稱相同,均包含了110個(gè)不同的基因,其中77個(gè)為蛋白編碼基因,29個(gè)tRNA和4個(gè)rRNA基因(圖1)。
表1、本研究所用14種水稻及Genbank數(shù)據(jù)庫登陸號(hào)列表
表2、4種水稻葉綠體基因組測(cè)序概況表
圖1、水稻葉綠體基因組圖譜
環(huán)內(nèi)基因轉(zhuǎn)錄為順時(shí)針方向,外環(huán)基因轉(zhuǎn)錄為逆時(shí)針方向。不同功能分組顯示不同顏色,粗黑線表明反向重復(fù)區(qū)域
2、SSR和重復(fù)序列分析
研究人員分析發(fā)現(xiàn)每個(gè)水稻品種葉綠體基因組有22-31個(gè)SSR(圖2),這些SSR大多數(shù)位于LSC/SSC區(qū)(92.0%)。SSR主要為A/T單堿基重復(fù)。分散重復(fù)序列大約有50-63個(gè),包括30-42個(gè)正向重復(fù)和19-22個(gè)反向重復(fù),它們?cè)谌~綠體基因組重排中發(fā)揮重要作用,主要分布在非編碼區(qū)域。
圖2、18種水稻葉綠體基因組SSR分析
圖3、18種水稻葉綠體基因組重復(fù)序列分析
3、系統(tǒng)發(fā)育樹分析
利用三種分析方法,能夠很好的得到18種水稻的系統(tǒng)發(fā)育樹結(jié)果(圖4)。18種水稻可以根據(jù)不同基因組類型分為7組,即AA、BB、CC、CCDD、EE、FF和GG。
圖4、基于全葉綠體基因組序列,采用最大似然法、貝葉斯推理法和最大簡約法重建系統(tǒng)發(fā)育樹
4、DNA條形碼開發(fā)及分析
根據(jù)SPIDER對(duì)葉綠體基因組遺傳距離的分析,發(fā)現(xiàn)3個(gè)區(qū)域具有顯著的高遺傳距離和低零成對(duì)距離比例,一個(gè)位于rpoC2編碼區(qū),另外兩個(gè)位于rps16-trnQ和rbcL-accD的基因間區(qū)。另外還有AA組中的trnTEYD和psbE-petL區(qū)域。
圖5、DNA條形碼開發(fā)
(A)18種水稻數(shù)據(jù)集中每個(gè)窗口的平均距離。(B)18種水稻數(shù)據(jù)集中每種零成對(duì)距離比例。(C)AA基因組數(shù)據(jù)集中每個(gè)窗口的平均距離。(D)AA基因組數(shù)據(jù)集中每種零成對(duì)距離比例。
條形碼分析結(jié)果如表3所示,單個(gè)基因檢測(cè)最高達(dá)到72.22%( rpoC2和rbcL-accD),而組合檢測(cè)結(jié)果則可以達(dá)到100%區(qū)分的效果,并于圖6建樹結(jié)果相同。
表3、水稻5個(gè)新marker及通用葉綠體DNA條形碼變化情況
圖6、利用水稻rbcL + matK及rps16-trnQ + rpoC2 + rbcL-accD + trnTEYD + psbE-pet DNA條形碼組合構(gòu)建的MP樹
結(jié)論:
關(guān)于天昊
天昊生物具有豐富的動(dòng)植物葉綠體、線粒體細(xì)胞器基因組和DNA條形碼檢測(cè)項(xiàng)目經(jīng)驗(yàn),幫助客戶發(fā)表文章近30篇,影響因子50多分,我們期待成為您細(xì)胞器基因組測(cè)序和DNA條形碼檢測(cè)的優(yōu)質(zhì)服務(wù)合作伙伴。
鏈接: