研究背景
白樺是中國北方常見的樹種,具有很高的經(jīng)濟(jì)和藥用價(jià)值。研究者多年致力于白樺基因組研究。葉綠體的完整基因組序列(cpDNA)作為主要細(xì)胞器基因組,對于研究物種的差異、RNA編輯和系統(tǒng)發(fā)育都非常重要。在本研究中,研究者對白樺的完整葉綠體基因組序列進(jìn)行了測序和分析。
研究方法
植物材料和測序
使用CTAB法從嫩葉中提取總基因組DNA。構(gòu)建paired-end (insert sizes = 200 bp, 500 bp 和
800 bp) 以及mate-pair (insert sizes = 2 kbp, 5 kbp和10 kbp)文庫,利用illumina HiSeq 2000進(jìn)行隨機(jī)測序。
數(shù)據(jù)過濾和cpDNA序列提取
使用NGSQC Toolkit (cut-off read length for HQ = 70%, cut-off quality score = 20, trim reads from 5’=3, trim reads from 3’=7)過濾原始reads。使用FastQC檢查clean reads質(zhì)量。為了鑒定cp序列,所有clean reads,包括來自細(xì)胞核和細(xì)胞器的序列,被映射到2670種植物的完整cpDNA序列,這些序列使用BWA工具從NCBI細(xì)胞器基因組資源數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/genome/organelle/)下載。最后從SAM文件中提取cp序列,并獲得三個paired-end reads文件。
基因組組裝和注釋
對于de novo cp基因組組裝,使用缺省參數(shù)的Edena組裝程序,將所有成對末端序列組裝成contigs。接下來,使用SSPACE將相鄰的具有成對末端或成對配對支撐的contigs合并成scaffolds。然后,利用另外兩種參考?xì)ざ房浦参铩?i>Betula nana (KX703002.1)和Ostrya rehderiana (KT454094.1)的cp基因組序列,組裝出一個帶有間隙的cp序列。此后利用GapCloser用來補(bǔ)充大部分缺口,Sanger測序被用來填補(bǔ)剩余缺口。使用BWA進(jìn)一步檢查完整的cp基因組序列。
除了tRNA基因,使用tRNAscan-SE 2.0進(jìn)行驗(yàn)證,白樺cp基因組序列使用在線葉綠體基因組注釋、可視化、分析和GenBank提交工具(CpGAVAS)進(jìn)行注釋。首先,AnnotateGenome被用來獲得GFF3格式的原始注釋結(jié)果。其次,研究者使用AnnotateGene、Apollo Genome Annotation和Curation Tool,根據(jù)CpGAVAS的參考數(shù)據(jù)庫和tRNAscan-SE進(jìn)行tRNA基因注釋,進(jìn)行手動糾正。最后,使用OrganellarGenomeDRAW生成修正的cp圈圖。
密碼子使用和替代起始密碼子統(tǒng)計(jì)
確定所有蛋白質(zhì)編碼基因的密碼子使用情況(RNA序列未經(jīng)編輯)。為了檢查同義密碼子使用的偏差,同時(shí)避免氨基酸組成的影響,使用MEGA 7軟件計(jì)算相對同義密碼子使用情況。
對三個cp基因( rps19、psbC和ndhD )用白樺cp基因組中的非ATG起始密碼子進(jìn)行注釋,根據(jù)被子植物系統(tǒng)發(fā)育組( APG ) IV系統(tǒng)從30種模式植物和代表性植物物種中選擇了這些基因。然后,這三個基因中第一個10?bp的序列l(wèi)ogo使用weblogo 3應(yīng)用程序創(chuàng)建,研究者還可視化了這些位點(diǎn)的RNA-Seq圖譜,并將它們與序列l(wèi)ogo進(jìn)行對。
基因組比較
利用mVISTA程序比較白樺和其他四個密切相關(guān)物種的完整cp基因組序列,這四個物種分別是B. pendula (LT855378.1)、B. nana (KX703002.1)、Corylus chinensis (KX814336.2)和Juglans sigillata (KX424843.1)。使用Needleman-Wunsch算法的改進(jìn)方法EMBOSS Stretcher進(jìn)行全局比對,用于比對這些cp基因組序列。
IR擴(kuò)展和收縮分析
根據(jù)殼斗科分類系統(tǒng),選擇了Betula platyphylla、Juglans regia (MF167463.1)、Morella rubra (KY476637.1) 和 Castanea mollissima (KY951992.1)四種植物分別代表樺木科、胡桃科、楊梅科和殼斗科。
SSR分析
通過將單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的最小重復(fù)次數(shù)分別設(shè)置為10、5、4、3、3和3,使用Perl腳本MISA (微衛(wèi)星識別工具)檢測簡單序列重復(fù)。同時(shí),CandiSSR被用于鑒定多態(tài)性SSRs ( PolySSRs ),并為三個樺木物種自動設(shè)計(jì)引物對。
RNA編輯位點(diǎn)的識別
利用3片葉子樣本的RNA-Seq實(shí)驗(yàn)來識別RNA編輯事件。從成熟樹葉中提取總RNA,構(gòu)建文庫進(jìn)行測序。使用HISAT2軟件與白樺cp基因組進(jìn)行比對。SAMtools、beddTools和ChloroSeq被用來調(diào)用和分析精確的RNA編輯位點(diǎn)。因?yàn)镾NPs或錯配可能會干擾結(jié)果,研究者還使用Bowdtie 2軟件將一組用于組裝白樺cp基因組的PE100?bp長度reads映射回cp基因組序列,然后檢查SNPs。最后,使用Primer Premier 6.0軟件設(shè)計(jì)了幾對引物,進(jìn)行目標(biāo)序列 PCR,利用Sanger測序證實(shí)了目標(biāo)代表性編輯位點(diǎn)。
系統(tǒng)發(fā)育分析和特征進(jìn)化
利用21種殼斗科植物的全部cp基因組序列構(gòu)建系統(tǒng)進(jìn)化樹,以確認(rèn)密切相關(guān)的白樺物種之間的遺傳關(guān)系。在進(jìn)化樹中,煙草被用作外部群體。使用MAFFT比對核苷酸序列。手動檢查和調(diào)整所有比對結(jié)果。MEGA-CC用來尋找最佳替代模型,建立最大似然( ML )系統(tǒng)進(jìn)化樹。使用具有500次重復(fù)的自舉重采樣來評估分支支持情況。
研究結(jié)果
白樺的完整cp基因組長度為160518?bp,包括一對26056?bp的反向重復(fù)序列( IRs ),它將89397?bp的大單拷貝( LSC )區(qū)域和19009?bp的小單拷貝( SSC )區(qū)域分開。注釋結(jié)果包含129個基因,包括84個蛋白質(zhì)編碼基因、37個tRNA基因和8個rRNA基因。使用替代起始密碼子的基因有3個。比較基因組學(xué)顯示,殼斗菜屬物種cp基因組的序列相對保守,但仍有一些高變異區(qū)可用作分子標(biāo)記。白樺的IR擴(kuò)增事件導(dǎo)致了更大的cp基因組和rps19假基因的形成。簡單序列重復(fù)( SSR )分析表明,白樺cp基因組中有105個SSR。RNA編輯位點(diǎn)識別表明cp基因組中至少發(fā)生了80次RNA編輯事件。大多數(shù)替換是C到U,而一小部分不是。特別是rRNA上的三個編輯位點(diǎn)被轉(zhuǎn)化為兩個以上從未報(bào)道過的堿基。對于同義轉(zhuǎn)換,其中大多數(shù)增加了密碼子的相對同義密碼子使用( RSCU )值。系統(tǒng)發(fā)育分析表明,白樺樹B. platyphylla與B. pendula的進(jìn)化關(guān)系比B. nana更密切。
部分研究圖表結(jié)果
圖1、白樺葉綠體基因組圖譜。如箭頭所示,圓圈內(nèi)的基因被順時(shí)針轉(zhuǎn)錄,圓圈外的基因被逆時(shí)針轉(zhuǎn)錄。灰色內(nèi)圈對應(yīng)于GC含量。屬于不同功能組的基因以不同的顏色顯示
表1、白樺葉綠體基因組基因列表
圖2、三個基因的序列l(wèi)ogo和RNA-Seq圖譜。a:該物種三個基因中10?bp的序列l(wèi)ogo圖。b:白樺三個基因中10?bp的RNA-Seq比對結(jié)果
圖3、以白樺為參照,利用mVISTA程序?qū)ざ房浦参锏?個葉綠體基因組進(jìn)行序列比對結(jié)果。比對上方的灰色箭頭表示基因的轉(zhuǎn)錄方向。基因組區(qū)域被顏色編碼為外顯子和保守的非編碼序列( CNS )。本圖使用了50%同一性的分界線。Y軸表示50 %到100 %之間的同一性百分比
圖4、四個殼斗科植物基因組中LSC、SSC和IR區(qū)域邊界的比較。ψ表示假基因
表2、RNA編輯位點(diǎn)和氨基酸變化列表(部分)
圖5、通過Sanger測序驗(yàn)證從RNA-Seq推斷的編輯位點(diǎn)
研究結(jié)論
在這項(xiàng)研究中,研究者不僅獲得并注釋了白樺的完整cp基因組序列,還鑒定了新的RNA編輯位點(diǎn),并預(yù)測了殼斗科植物物種之間的系統(tǒng)發(fā)育關(guān)系。這些發(fā)現(xiàn)將促進(jìn)這一重要物種的基因組、基因工程和系統(tǒng)發(fā)育研究。
關(guān)于天昊
天昊生物具有豐富的動植物葉綠體、線粒體細(xì)胞器基因組和DNA條形碼檢測項(xiàng)目經(jīng)驗(yàn),為客戶高效發(fā)表SCI文章提供技術(shù)保障,我們期待成為您細(xì)胞器基因組測序和DNA條形碼檢測的優(yōu)質(zhì)服務(wù)合作伙伴,歡迎聯(lián)系我們具體咨詢!郵箱:[email protected] 電話:400-065-6886