大规模鉴定环形RNA (circular RNAs, circRNAs)如高通量测序等实验中,使用RNase R富集circRNAs (消化线性RNA)基本已成为“金标准”。而3’-5’ 外切酶RNase R的特性(如不能消化3’突出末端小于7nt的双链RNA)决定了其消化能力相对有限,实验过程中也确实发现线性RNA未能彻底消化、circRNA-seq数据中含有不少线性RNA reads等现象。

Panda AC 等人于2017年介绍了一种新的方法RPAD(high-purity circular RNA isolation method),将总RNA经RNase R消化后先使用oligo(dT)磁珠去除残留的线性RNA,接着使用E-PAP给可能残留的线性RNA加上poly(A)尾,然后再一次使用oligo(dT)磁珠去除线性RNA。该方法进一步增加了circRNAs的纯化富集效率,通过测序也发现了更多内含子来源的circRNAs [1]。

在circRNAs研究领域已有多项重要成果的宾夕法尼亚大学Jeremy E. Wilusz教授团队近期介绍了一种改进的新型circRNAs纯化方法,发表在Nucleic Acids Research上。

RNase R消化后残留大量的线性RNA

作者使用常规的RNase R反应体系(37℃ 15min, KCl buffer)对Hela细胞total RNA进行RNase R消化处理,随后进行高通量测序。结果显示大部分线性RNA被去除,而环形RNA得到富集,但数据中有大量线性RNA的reads,特别是mapping到第一或最后一个外显子上的reads。接着挑选表达丰度高的前25%基因做分析,计算序列覆盖度RPKM的比值(RNaseR/Control),发现有1015个基因的比值≥1,表明覆盖这些序列(exon)的线性RNA可能耐受RNase R消化。作者同时分析了另外两组已发表的测序数据,也发现一些线性基因耐受RNase R消化。

图1 大量的线性RNA耐受RNase R消化

结构化线性RNA的3’突出末端长度影响消化效率

除了大部分的线性RNA,RNase R也能够消化有高级结构的线性RNA(如3’突出末端大于7nt的双链RNA),而没有3’突出末端的结构化线性RNA (如snRNAs, snoRNAs, Y RNAs, 组蛋白mRNAs和长链非编码RNA MALAT1) 可能不会被消化,文章测序结果中也确认存在这些耐受消化的结构化线性RNA。因此作者参考RPAD方法,使用E-PAP处理total RNA后再进行RNase R消化,发现这些结构化线性RNA(3’突出末端添加了poly(A)尾)能被高效消化,但依然残留有一些耐受消化的mRNAs,延长反应时间也同样耐受消化。

图2 部分mRNAs耐受RNase R消化

RNase R消化在G-四联体处“抛锚”

作者继续分析测序数据,并进行Northern blot实验检测RNA,发现这些耐受消化的mRNAs并不是完全不被消化,而是RNase R从3’-5’方向消化时在某个位置“抛锚”了,不能沿着链的方向继续消化,因此残留的是3’末端部分被消化而被截短的mRNAs。

图3 RNase R消化“抛锚”后残留被截短的mRNAs

以上结果提示耐受消化的mRNAs可能有固定的序列或结构特征。作者使用DaPars预测“抛锚”位置,鉴定出337个G富集的“抛锚点”序列,考虑到G富集的序列可能形成G-四联体(G-quadruplex),分析经实验验证的G-四联体信息,发现其中255个“抛锚点”附近有注释的G-四联体序列。使用QGRS Mapper继续分析,与随机序列相比,另外的82个“抛锚点”序列明显更有可能形成G-四联体。

图4 “抛锚点”序列能形成G-四联体

反应buffer的改进

确认RNase R的消化是在G-四联体处“抛锚”之后,想办法打开(减弱)G-四联体就有可能消除这种“抛锚”。考虑到G-四联体的形成是需要一价阳离子配位去稳定的,而离子半径更小的阳离子不容易稳定这样的结构。因此将反应buffer中的KCl改为LiCl或者NaCl就有可能减弱G-四联体的形成,从而增加RNase R消化含G-四联体RNA的效率。(离子半径:K+, 133pm; Na+, 95pm; Li+, 60pm)

作者将反应buffer中的KCl替换为LiCl或NaCl,使用RNase R消化total RNA或含有3’UTR-G4-GFP报告序列的RNA,确认能有效消化之前验证耐受消化并含G-四联体的RNA。缺点是使用NaCl-buffer或LiCl-buffer的消化效率比使用KCl-buffer低,但可以通过延长消化时间去弥补。

图5 改进buffer能有效消化含G-四联体的RNA

纯化方法的改进

接下来作者综合考虑3’突出末端和G-四联体对RNase R消化效率的影响,将反应体系做了改进,即先对total RNA进行E-PAP处理,然后使用LiCl-buffer进行RNase R消化。RT-PCR实验显示组合的改进方法能保证常见的外显子来源circRNAs得到富集,并高效率消化snRNAs和含G-四联体的mRNAs等。高通量测序显示对线性RNA的消化效率更高,之前发现的1015个耐受消化的线性RNA此时也能被RNase R高效率消化。计算发现使用组合的改进方法时circRNAs的富集程度是常规KCl-buffer消化的2-3倍,数据中backsplicing junction reads的比例也有提升。

图6 组合的改进方法能有效提高circRNAs富集程度

总结与讨论

使用这种改进的组合A-Tailing/LiCl-buffer RNase R消化方法,我们能获得更高的线性RNA去除和circRNAs富集效率,得到纯度更高的circRNAs。高通量测序中有利于提高有效的backsplicing junction reads的比例和数量,可能发现更多的circRNAs。

图7 组合的A-Tailing/LiCl-buffer RNase R消化方法

另外G-四联体被认为在RNA转录、剪切和定位等多个环节发挥作用,但不在真核细胞内大量形成(天然存在)。这里使用RNase R消化含G-四联体的RNA都是在体外做的,那在细胞内表达RNase R是否依然能从3’-5’方向消化线性RNA并在G-四联体处“抛锚”?如果可以,这也可能应用于鉴定细胞内天然存在的G-四联体。

对于circRNAs的纯化,或许也可以使用TAP或者5’ RppH打开mRNA的5’帽子结构,然后使用5’-3’核酸外切酶Xrn1消化线性RNA。或者同时使用RNase R和Xrn1,分别从3’-5’和5’-3’方向消化线性的RNA,以期去除掉几乎所有的线性RNA。

参考文献:

  1. Panda AC, De S, Grammatikakis I, Munk R, Yang X, Piao Y, et al.. High-purity circular RNA isolation method (RPAD) reveals vast collection of intronic circRNAs. Nucleic Acids Res. 2017 Jul 7;45(12):e116. doi: 10.1093/nar/gkx297.
  2. Xiao MS, Wilusz JE. An improved method for circular RNA purification using RNase R that efficiently removes linear RNAs containing G-quadruplexes or structured 3′ ends. Nucleic Acids Res. 2019 Jul 3. pii: gkz576. doi: 10.1093/nar/gkz576.

 

发表评论