Several Questions about NGS(For Illumina platform)

Q1:血清/血浆及其外泌体样本是否可以进行circRNA测序?

A1:可以。血清/血浆及其外泌体样本中的RNA片段化程度较高,大小在200nt以上的RNA含量少,浓度低,且样本采集过程及保存条件对RNA质量影响较大。因此,最好选用2mL以上半年内收集的无反复冻融的血清/血浆样本。

Q2:建库测序之前常用Agilent 2100生物分析仪对RNA样本进行质检,其结果如何看?

A2:一看RNA完整性: RNA质检峰图可以直观地反映出RNA的完整性,类似琼脂糖凝胶电泳图,但其灵敏度更高;同时报告中会提供28s/18s 核糖体RNA的比值和RIN值(RNA Integrity Number)。RIN值是对RNA完整性、纯度或降解程度的数字化评估,一般RIN值大于7时,认为RNA完整性较好,满足后续建库测序要求。

二看RNA浓度:RNA质检时会根据峰图积分面积计算出所测样本RNA的浓度,可与其他浓度检测仪器(如Qubit或Nanodrop)所测浓度进行对比,如两者数值相差较大,可考虑是否存在基因组DNA污染等。

Q3:常规的细胞或组织样本与血清/血浆、外泌体、FFPE等特殊样本在做全转录组测序时数据质量是否有不同?

A3:会有不同。常规细胞或组织样本抽提出来的RNA质量较高,建库起始量足够,测序数据质量较好,一般有效数据mapping率85%以上;而血清/血浆、外泌体、FFPE等特殊样本RNA降解程度较高,浓度低,建库起始量不足,测序数据质量较差,一般有效数据mapping率50%左右。

Q4:核酸片段化的方法是什么?

A4:在构建二代测序文库时,通常要将样本DNA或RNA进行片段化。DNA片段化的方法主要有酶学方法和物理方法。常用的DNA片段化酶有转座酶(如Tn5)和非特异的核酸内切酶(如NEB的NEBNext dsDNA Fragmentase)。DNA片段化的物理方法主要是超声剪切,比较常用的仪器有Covaris和Bioruptor。RNA片段化常用的方法是在高温条件下利用金属阳离子(如Mg2+,Zn2+)作用一定时间。其片段化程度与缓冲液的PH值、阳离子的浓度、反应温度及时间有关。

Q5: 分选文库插入片段大小的方法及原理是什么?

A5: 目前所采用的分选文库目的片段的方法为磁珠法。它是一种基于固相载体可逆化固定(SPRI)的分离纯化方法。磁珠体系中一般包含:磁珠、DNA、聚乙二醇(PEG)以及盐离子等。DNA在一定浓度的PEG存在条件下,NaCl或MgCl2促进条件下,使DNA发生脱水反应,分子构象会发生急剧变化,由线状被压缩形成卷曲球状,继而聚集沉淀。通过加入不同比例的磁珠,形成不同浓度的PEG及盐离子缓冲溶液,使不同长度的DNA片段可以被选择性的沉淀出来。

Q6: 为什么常规全转录组测序要先去除rRNA?

A6:核糖体RNA的遗传信息的保守性较高,在不同组织、器官中也十分稳定,研究者更倾向于研究信息含量更为丰富的mRNA、非编码RNA以及circRNA等。在抽提所得的总RNA中,80%以上都是核糖体RNA,如采用Oligo dT磁珠捕获mRNA则会丢失不含polyA尾的lincRNA、circRNA等。因此,采用去除rRNA的建库方式能最大程度地保留转录组RNA信息,提高测序有效数据量。

Q7:全转录组测序与circRNA测序有什么不同?

A7:全转录组测序采用去rRNA链特异性的建库方式,数据分析内容包含了mRNA、lncRNA及circRNA全部信息,数据质量较好。CircRNA测序采用去rRNA去线性链特异性的建库方式,通过RNase R 消化线性RNA从而富集circRNA,对建库起始量要求较高(一般大于2μg),测序数据质量较全转录组稍差,但可将circular junction reads数提高10倍以上,更适合专注circRNA研究的项目。

Q8:文库构建中的“Index”、“Adapter ” 和 “Primer”有何异同?

A8:“Index”即标签序列,用以在建库测序中区分不同的样品,也称之为“Barcode”。常用的index一般为6碱基或8碱基,可选择在文库单端或双端插入。

“Adapter”指的是二代测序文库构建时所用的接头,其作用是使DNA或cDNA片段带上可用于后续上机测序的特定序列(具体序列与选择的测序平台有关,这里指的Illumina测序平台),一般分为universal adapter(如NEB的U型接头)和complete adapter(如Illumina的Y型接头)两种。两者的区别是后者带有完整的上机测序所需的序列信息,且带有不同的Index序列。

“Primer”即引物,在二代测序文库构建中主要指的是文库扩增时所用的引物,也分为两种,一种与universal adapter配套使用,上游引物为通用引物,下游引物带有不同的Index;另一种与complete adapter配套使用,上下游均为通用引物,一般混为“Primer Mix”使用。

Q9: 二代测序中,Illumina测序平台要怎么选择?

A9:一般测序平台是根据文库的插入长度及其数据量需求进行选择。Illumina常用的测序平台有Miseq,Hiseq2500、HiSeq Xten和Novaseq6000。Miseq系列的测序模式有PE250和PE300,读长分别为500和600个碱基,16s文库一般都选择这两种模式。Hiseq2500常用的模式为SR50和PE250,SR50读长为50个碱基,small RNA测序一般选择这种模式;PE250读长为500个碱基,16s文库或插入较长的文库会选用该模式。HiSeq Xten和Novaseq6000常用模式为PE150,其读长为300个碱基,大部分的RNA文库和DNA文库均采用该模式进行测序。

Q10:测序数据需求量有xM reads数和数据量xG base两种表示方法,这两者的区别是什么?

A10:高通量测序平台经过桥式PCR产生的cluster数量就称为reads数,如small RNA文库产生的数据量是10M reads,意为该文库在测序过程中产生了1千万条reads。数据量data表示的是测序所得的碱基总数,如circRNA文库产生数据量为10G,意为该文库在测序过程中读取了100亿个碱基的信息。Reads数和数据量data是可以进行转换的,reads数与测序读长的乘积即为数据量data。如文库在PE150模式测序产生了30M的reads数,则其数据量约为9G base。

 

发表评论