背景介紹
罕見遺傳性疾病的臨床診斷仍然面臨諸多問題:
● 外顯子組測(cè)序的診斷率僅為25%-30%。
● 全基因組測(cè)序獲得的非編碼區(qū)序列可占90%,但破壞mRNA正常剪切模式的非編碼區(qū)突變因難以準(zhǔn)確鑒定而常常被忽略。
● 尚沒有非常準(zhǔn)確的工具可預(yù)測(cè)單個(gè)核苷酸變異而引起的剪切變化
人工智能軟件SpliceAI
人工智能軟件的飛速進(jìn)步,或能幫助我們從新一代測(cè)序(NGS)數(shù)據(jù)中發(fā)現(xiàn)與罕見遺傳病相關(guān)的非編碼突變。SpliceAI工具由Illumina團(tuán)隊(duì)與加州大學(xué)舊金山分校和斯坦福大學(xué)的合作者共同開發(fā),基于深度學(xué)習(xí)預(yù)測(cè)單個(gè)核苷酸變異而引起的剪切變化, 從任意mRNA前體序列對(duì)剪切位點(diǎn)進(jìn)行準(zhǔn)確預(yù)測(cè)(位置、異常剪切概率),從而對(duì)非編碼RNA區(qū)域的突變所導(dǎo)致的異常剪切進(jìn)行預(yù)報(bào),相關(guān)文章于2019年1月發(fā)表在Cell期刊。
文章圖片摘要
● SpliceAI軟件,基于32個(gè)卷積的深度神經(jīng)網(wǎng)絡(luò), 從mRNA前體序列對(duì)剪切位點(diǎn)進(jìn)行準(zhǔn)確預(yù)測(cè)
● 75%的預(yù)測(cè)異常剪切突變通過RNA-seq數(shù)據(jù)被證實(shí)
● 在神經(jīng)發(fā)育障礙患者中,約10%的致病突變可能為剪切非編碼突變,這種突變會(huì)導(dǎo)致異常剪切。
● 異常剪切點(diǎn)突變經(jīng)常導(dǎo)致可變剪切
● 參考文獻(xiàn):Jaganathan K , Kyriazopoulou Panagiotopoulou S , Mcrae J F , et al. Predicting Splicing from Primary Sequence with Deep Learning[J]. Cell, 2019.
軟件下載
python包: https://github.com/Illumina/SpliceAI
運(yùn)行過程
● 用法
spliceai -I input.vcf -O output.vcf -R genome.fa -A grch37 -D 50
-I: vcf 文件
-O: vcf文件,預(yù)測(cè)結(jié)果SpliceAI=ALLELE|SYMBOL|DS_AG|DS_AL|DS_DG|DS_DL|DP_AG|DP_AL|DP_DG|DP_DL
-R: 參考基因組fasta文件(GRCh37/hg19 or GRCh38/hg38)
-A: grch37 or grch38,還可自定義文件,格式同“基因數(shù)據(jù)庫(kù)文件grch37.txt or grch38.txt”
-D: 突變位點(diǎn)和剪切位點(diǎn)的最大距離(default: 50)
-M: 0: raw files; 1: masked file (default: 0)
● 基因數(shù)據(jù)庫(kù)示例
● 輸入文件示例(vcf文件:存儲(chǔ)檢測(cè)的變異位點(diǎn)信息)
input.vcf
● 輸出文件示例
output.vcf
● 結(jié)果解讀--官網(wǎng)
● 結(jié)果解讀--示例
突變2:179415988 C>CA的輸出CA|TTN|0.07|1.00|0.00|0.00|-7|-1|35|-29可以解釋如下:
位置179415981(179415988-7) 突變導(dǎo)致當(dāng)前位點(diǎn)作為剪切受體的概率增加0.07;
位置179415987(179415988-1) 突變導(dǎo)致當(dāng)前位點(diǎn)作為剪切受體的概率降低1.00;
位置179416023(179415988+35) 突變導(dǎo)致當(dāng)前位點(diǎn)作為剪切供體的概率增加0.00;
位置179415959(179415988-29 ) 突變導(dǎo)致當(dāng)前位點(diǎn)作為剪切供體的概率降低0.00。
延伸閱讀-非編碼區(qū)內(nèi)含子變異導(dǎo)致可變剪切的文章
● 在來自挪威、法國(guó)和美國(guó)的20個(gè)家庭中發(fā)現(xiàn)了遺傳性乳腺癌卵巢癌綜合征1型的致病基因BRCA1新的致病突變c.5407-25T>A,在此之前,該突變一直被判定為臨床意義未明。
參考文獻(xiàn):H?berg-Vetti, H., Ognedal, E., Buisson, A. et al. The intronic BRCA1c.5407-25T>A variant causing partly skipping of exon 23—a likely pathogenic variant with reduced penetrance?. Eur J Hum Genet (2020). https://doi.org/10.1038/s41431-020-0612-1
● VHL基因2號(hào)外顯子上的同義突變或可導(dǎo)致外顯子跳躍,從而引發(fā)家族性紅細(xì)胞增多癥或或von Hippel-Lindau病。
參考文獻(xiàn):Marion Lenglet,et al.New lessons from an old gene: complex splicing and a novel cryptic exon in VHL gene cause erythrocytosis and VHL disease. Blood 2018 :blood-2018-03-838235; doi: https://doi.org/10.1182/blood-2018-03-838235
天昊WGS服務(wù)升級(jí)!
目前,天昊全基因組測(cè)序個(gè)性化分析流程已納入SpliceAI分析內(nèi)容,針對(duì)新的WGS分析項(xiàng)目或者已完成的WGS分析,可開展基于SpliceAI軟件預(yù)測(cè)可引起RNA剪切變化的非編碼區(qū)突變。
SpliceAI,助力天昊生物WGS平臺(tái)給您更好的突變解讀,歡迎老師體驗(yàn)!