拒绝“一剪没”!全长转录组实现可变剪切深度解析
2018.09.19

夏日的炎热刚刚褪去,天气中却飘来了乌云,一如实验室梁师兄不宁的心绪。辛勤了一个暑假的梁师兄,此刻却对着电脑屏幕前的转录组数据挠起了头:“马上要向导师汇报了,可文献中报道的转录本异构体,我怎么就鉴定不到呢?一定是可变剪切搞的鬼!”伴随着耳机里逐渐响起的《一剪梅》,梁师兄正要仰天大喊“不——!”时,导师却翩然而至,一把摘下梁师兄的耳机,轻轻说出五个字,梁师兄的脸色顿时由阴转晴。到底是哪五个字有这等魔力?只听得梁师兄口中喃喃道:“全长转录组,是全长转录组。”


没错,全长转录组测序(iso-seq)凭借读长优势,能够直接获得由5’端至3’端poly(A)尾的完整mRNA序列。它的重要应用领域之一,就是对可变剪切(alternative splicing)的精确鉴定和分析(图1)。真核生物中,由单一基因转录产生的mRNA前体可以通过内含子保留等不同的剪切形式产生多种转录本异构体(isoforms)。经过翻译,这些mRNA往往产生结构和功能不同的蛋白质。因此,真核生物可以在不显著增加基因数量的前提下,利用可变剪切大大增加转录组和蛋白组的复杂性。目前,越来越多的研究采用了iso-seq来全面揭示可变剪切的复杂性,小编就借用近期发表的文献为大家作介绍。


图1 全长转录组中的可变剪切分析

图1 全长转录组中的可变剪切分析

 

可变剪切的整体分析


通过将iso-seq得到的转录本信息与参考基因组比对,可以对可变剪切事件进行整体分析,获得已知基因对应的不同isoforms。家兔(Oryctolagus cuniculus)的全长转录组研究[1]就发现,参考基因组中有近一半的基因位点(6,418)可表达两种以上的isoforms。它们的背后是近25,000个新鉴定到的可变剪切事件;相比之下,仅有不到1/10的可变剪切在参考基因组中得到注释(表1)。


表1 家兔全长转录组测序与Ensembl注释的可变剪切事件对比统计

表1 家兔全长转录组测序与Ensembl注释的可变剪切事件对比统计


同样,近期发表的野猪(Sus scrofa)全长转录组研究[2]显示,超过30%的基因位点(8,062)可表达两种以上的isoforms,总数约为45,000。该研究鉴定到100,000个可变剪切事件,相比参考基因组注释,提升18倍之多!


图2 野猪全长转录组的转录本异构体(isoforms)及可变剪切分析

图2 野猪全长转录组的转录本异构体(isoforms)及可变剪切分析


可变剪切的差异分析


除单独的全长转录组分析外,许多关注可变剪切的研究还常常将iso-seq同二代转录组测序(RNA-seq)相结合。采用这样的2+3联合分析策略,研究者既可以直接对比不同样品间的全长转录组数据,也可以进行基于二代数据的isoform表达量分析,从而找到可变剪切的差异及其意义。


在棉花(Gossypium barbadense)的可变剪切整体分析[3]中,研究者注意到同一基因的多种isoforms在不同组织中存在特异性表达。因此,研究者对比了棉花纤维与非纤维组织的全长转录组数据,分别找到约15,000和48,000个特异性可变剪切事件(图3),并发现了它们主要参与的生物过程。进一步采用2+3联合分析,该研究证明了可变剪切与isoform的组织特异性是一致的,说明可变剪切是棉花实现基因表达组织特异性的关键分子机制。


图3 异源四倍体棉花中的组织特异性可变剪切事件及其对应的转录本异构体(isoform)

图3 异源四倍体棉花中的组织特异性可变剪切事件及其对应的转录本异构体(isoform)


近期发表的杨树(Populus trichocarpa)全长转录组研究[4]同样采取了2+3联合分析的策略,对可变剪切在逆境响应中的重要作用进行了深入挖掘。可变剪切的分析结果显示,内含子保留是杨树中占占主导地位的剪切形式,比例高达45%。对比不同条件下由可变剪切产生的isoform及其表达量,该研究发现差异性内含子保留(differential intron retention, DIR)是杨树应对干旱等逆境胁迫的重要分子机制。许多参与植物发育、细胞壁代谢、昼夜节律及应激反应的基因(如ptAC2B,图4)均受到DIR的调控。在不同的逆境胁迫下,这类内含子表现出协同性的保留上调或下调。Iso-seq可以直接获得这类isoform的完整序列,从而验证了RNA-seq结果。


图4 杨树在逆境胁迫下发生的差异性内含子保留(DIR)调控

图4 杨树在逆境胁迫下发生的差异性内含子保留(DIR)调控


相信看到这里,屏幕前的梁师兄和各位读者已经了解全长转录组在可变剪切研究中的重要应用了。安诺基因愿全长转录组能助您的科研事业再上新台阶,转录组数据从此不再“一剪没”。


参考文献

[1] Chen, S.Y., Deng, F., Jia, X., Li, C. and Lai,S.J., 2017. A transcriptome atlas of rabbit revealed by PacBio single-molecule long-read sequencing. Scientific reports, 7(1), p.7648.

[2] Li, Y., Fang, C., Fu, Y., Hu, A., Li, C., Zou,C., Li, X., Zhao, S., Zhang, C., Li, C. and Ohara, O., 2018. A survey of transcriptome complexity in Sus scrofa using single-molecule long-read sequencing. DNA Research.

[3] Wang, M., Wang, P., Liang, F., Ye, Z., Li, J.,Shen, C., Pei, L., Wang, F., Hu, J., Tu, L. and Lindsey, K., 2018. A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulation. New Phytologist, 217(1), pp.163-178.

[4] Filichkin, S.A., Hamilton, M., Dharmawardhana,P.D., Singh, S.K., Sullivan, C., Ben-Hur, A., Reddy, A.S. and Jaiswal, P., 2018. Abiotic Stresses modulate landscape of poplar transcriptome via alternative splicing, differential intron retention, and isoform ratio switching. Frontiers in plant science, 9, p.5.


在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980