链特异性RNA-Seq优势细数
2016.01.08


自LncRNA成为热点以来,链特异性转录组测序(strand-specific RNA-Seq,ssRNA-Seq)作为“始作俑者”,与传统RNA-Seq相比,除了LncRNA的预测和发掘,在后续的其他分析中更具有超乎想象的优势。


小编不是知识的主要创造者,但却是辛勤的传播者,在细数它的优势之前,先给大家扫盲一下什么是ssRNA-Seq?


拿蛋白编码基因来说,ssRNA-Seq可以区分科研大神手上拿到的序列是来自该基因本身还是它的反向互补序列[1]。因为蛋白编码基因的研究广泛而深入,大神们能够通过注释得到它们大量的信息,所以自然不会觉得序列来自于哪一条链到底有多重要。But wait,如果大神得到未知的差异表达non-coding RNA,并且要设计siRNA去研究潜在功能,是不是要考虑一下手上的序列是“真身”还是“替身”?这时候,就需要ssRNA-Seq来大显身手啦!


OK,扫盲结束,ssRNA-Seq主要有以下6点优势。


1
分清彼此,精确定量


KHNYN和SDR39U1基因.png


如图,KHNYN和SDR39U1是一对overlapped基因,它们来自于人第14号染色体,前者来自正义链,后者来自反义链。应用RPKM计算它们表达量时,如果不区分文库中reads的链特异性,很可能会使得二者的表达量虚高[2,3]


2
发掘circRNA(circular RNA)

circRNA.png


作为新晋明星分子,circRNA是非编码RNA重要组成部分,在基因表达调控中有重要作用,比如充当microRNA的“临时仓库”(microRNA sponges)。应用ssRNA-Seq技术,哈佛医学院系统生物学系的科学家在疟原虫中发现并证实了一个由ARP(apoptosis related protein,凋亡相关蛋白)编码的circRNA,,命名为ARP_circRNA。如图所示,该circRNA由ARP基因的第3号、第4号外显子和二者之间的内含子序列编码[4]


3
发掘顺式天然反义转录本 (cis-natural antisense transcripts, cis-NATs)

顺式天然反义转录本.png


如图所示,红色的为正常的蛋白编码基因,而蓝色的是该基因的NAT,NAT对蛋白编码基因有重要的调节作用。研究表明,这种调节模式在发育、代谢和其他很多生物学过程中扮演了重要角色,是调控网络的构成之一。ssRNA-Seq有利于发掘大量潜在的cis-NATs[5,6]


4
全景式展现RNA世界


RNA世界.png


因为增加了链特异性识别的过程,所以在原有RNA-Seq基础上,通过设置合理的实验步骤和分析过程,可以鉴别出包含tRNA, mRNA, siRNA,miRNA, snoRNA, snRNA, lncRNAs等众多RNA分子,进而全面了解RNA世界[7]


5
提升3`UTR和基因组复杂位点的注释水平


AT1G68945基因.png


如图,AT1G68945基因位于拟南芥第1号染色体上。最初结合EST文库和链非特异性RNA-Seq初步估计该基因的方向为正义链的5'→3'。然而,在结合链特异性文库测序DRS (Direct RNA Sequencing)之后,可以清晰看到在反向3'end检测到高丰度的reads(灰色框中蓝色柱状丰度图),由此确定该基因位于反义链上,修正了原有的注释[8]


6
高级进阶,全长转录本的获得——Direct Ligation of Adaptors to First-strand cDNA, DLAF


ssRNA-Seq建库测序.png


如图,dUTP指示的紫红色柱子代表的是现在最常用的ssRNA-Seq建库测序方法,而DLAF指示的绿色柱子代表的是目前为止直接测序cDNA第一链的代表方法。可以看到,无论5'end还是3'end,DLAF方法的覆盖度都比dUPT高。这是ssRNA-Seq方法的高级进阶版本,对基因结构预测和分析(如转录起始位点TSS)有重大促进作用[9]


当然,除了以上,ssRNA-Seq在基因组组装、可变剪接事件检测等方面作用不可小觑,不一而足,更多有关ssRNA-Seq的传说留给大家叙说。


[1]  Parkhomchuk D, Borodina T, Amstislavskiy V, et al.Transcriptome analysis by strand-specific sequencing of complementary DNA[J]. Nucleic acids research, 2009, 37(18): e123-e123.

[2]  Tsai K W, Chang B, Pan C T, et al. Evaluation andApplication of the Strand-Specific Protocol for Next-Generation Sequencing[J]. BioMed research international, 2015.

[3]  Zhao S, Zhang Y, Gordon W, etal. Comparison of stranded and non-stranded RNA-seq transcriptome profiling andinvestigation of gene overlap[J]. BMC genomics, 2015, 16(1): 675.

[4]  Broadbent K M, Broadbent J C,Ribacke U, et al. Strand-specific RNA sequencing inPlasmodium falciparummalaria identifies developmentally regulated long non-coding RNA and circularRNA[J]. BMC genomics, 2015, 16(1): 454.

[5]  Li S, Liberman L M, Mukherjee N,et al. Integrated detection of natural antisense transcripts usingstrand-specific RNA sequencing data[J]. Genome research, 2013, 23(10):1730-1739.

[6]  Lu T, Zhu C, Lu G, et al.Strand-specific RNA-seq reveals widespread occurrence of novel cis-natural antisensetranscripts in rice[J]. BMC genomics, 2012, 13(1): 721.

[7]  Derks K W J, Misovic B, van denHout M C G N, et al. Deciphering the RNA landscape by RNAome sequencing[J]. RNAbiology, 2015, 12(1): 30-42.

[8]  Schurch N J, Cole C, SherstnevA, et al. Improved annotation of 3’untranslated regions and complex loci bycombination of strand-specific Direct RNA Sequencing, RNA-seq and ESTs[J]. PloSone, 2014, 9(4).

[9]  Agarwal S, Macfarlan T S,Sartor M A, et al. Sequencing of first-strand cDNA library reveals full-length transcriptomes[J].Nature communications, 2015, 6.


在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980