液体活检是医学检验的重要发展方向,人体体液中的成分鉴定是开发有效的液体活检标志物分子和技术的重要基础性工作。近期,Cell Reports发表了一项人体体液RNA转录组计划(Human Biofluid RNA Atlas Project)的研究成果,共收集了20例不同的体液,利用外参标记法对这些体液中转录组RNA进行了高通量分析。这一工作对开发基于RNA的液体活检技术有重要意义。文章的通讯作者是根特大学的Pieter Mestdagh教授。

本文作者收集并分析了20种不同的体液,高通量测序分析了其中的mRNA,circRNA和小RNA。通过添加化学合成的外参标准品,实现了不同体液样品RNA含量的横向比较。结果显示,不同体液标本中RNA含量的差异超过10000倍。作者还发现体液中circRNA的丰度普遍高于组织,每种体液的转录组中都有组织和细胞特异性的RNA分子。本项工作对于开发基于RNA的液体活检技术有重要价值,下面我们就一起学习一下:

研究流程

作者首先选择了不同来源体液标本,测试了添加外参标准品进行体液转录组分析的可行性,得到一整套完整的mRNA,circRNA和小RNA的数据。这部分的样本群体称为“discovery cohort”,包含了 20种不同的体液类型,每种体液选两个平行标本。这20种体液包括:羊水,房水,腹水,胆汁,支气管灌洗液,母乳,脑脊液,初乳,胃液,胰腺囊肿液,血浆,唾液,精液,血清,痰,粪便,滑液,汗液,泪液和尿液。Discovery cohort标本群同步检测了小RNA和mRNA捕获测序。

在这项研究基础上,作者选择了4种人类疾病进行分析,称为“case/control cohorts”。详细信息包括:8例慢性阻塞性肺疾病(COPD)患者与8例对照的痰标本;12例膀胱癌患者对12例对照的尿液样本;12例胶质母细胞瘤患者与12例脑积水患者的脑脊液样本;12例糖尿病患者与12例对照的唾液样本。这部分的标本只进行了mRNA捕获测序分析。

外参选择:该项分析共使用了四种不同的外参体系:Sequin spikers;RC spikers;ERCC spikers;LP spikers;其中Sequin和RC在RNA分离前添加,ERCC和LP在分离RNA后去除基因组DNA前添加。四种外参体系共包含了189种RNA分子。

Pearson相关性分析数据表明,在discovery cohort分析流程中预期的外参测序值与实验所得表达值的相关性均比较理想,四种外参的相关性系数分别为:Sequin (0.5-1.0);RC(0.44-0.98);ERCC(0.92-1.0);LP (0.4-0.96)。精液和泪液的测序数据中外参的效果较差,主要原因是高丰度的内源RNA。外参之间的比值也可以反映RNA提取效率,Sequin/ ERCC,RC/LP可分别表征mRNA和小RNA的分离效率。结果显示,不同样本间Sequin/ ERCC差异170倍,RC/LP104倍。这些外参体系还可以作为数据标准化的依据(Normalization),基于外参Reads数和体积的标准化,其中Sequin作为mRNA的标准化依据,RC作为小RNA的标准化依据。

图1 人体体液RNA转录组计划流程图([1])

不同体液样品中RNA丰度的高度多样性

Discovery cohort数据表明,mRNA的数据mapping总体好于小RNA。mRNA数据中mapping最好的是精液(97%),最差的是粪便(16%)。小RNA mapping最好的是富血小板血浆(95%),最差的是粪便,唾液和脑脊液(~7%)。RNA丰度最高和最低的相差接近1万倍,最高的包括泪液,精液和胆汁,最低的包括无血小板血浆,尿液和脑脊液。mRNA的总含量存在较大差异,浓度最高的是胆汁(33.973 ng / mL),最低的是房水(0.002 ng / mL)。mRNA含量与小RNA的含量有较高的相关性,说明在体液标本中,mRNA含量高的,小RNA含量也高,反之亦然。丰度最高的前10种mRNA来看,房水中这些mRNA的Reads数占到总Reads数的70%左右,而富血小板血浆和无血小板血浆中这些Top10 mRNA也占到50%左右的比例。而羊水中,Top10的mRNA仅占总RNA丰度的7%。小RNA方面,丰度最高的Top10分子的丰度在不含血小板血浆,尿液和血清中占到中Reads数的90%,在支气管肺泡灌洗液中占到57%。不同体液中检测到的Count数大于4的mRNA或小RNA分子,胰腺囊液中多达13722个mRNA房水中仅有107个mRNA分子,而眼泪中有231个miRNA分子而粪便中仅有18个miRNA分子。

图2  不同体液标本测序获得分子数的统计分析 ([1])

体液中circRNA占比高于组织

mRNA捕获芯片可以同步捕获mRNA外显子来源的circRNA,此前曾有一篇Cell文章基于该技术系统分析了多种肿瘤组织的circRNA表达丰度,并构建了MiOncoCirc数据库(推荐阅读:重磅!Cell杂志同期发布两篇circRNA研究文章)。本文中,作者用自测数据和这项研究的数据进行比较。很多circRNA在测序数据中仅在特定样品中出现过,文中称为unique circRNA,这种“unique circRNA”在组织样品中更常见,本文测的体液样品中这类circRNA少于组织样品。另一个指标,称为circRNA占比(circRNA fraction),主要是计算同一个基因来源的circRNA与线性mRNA的测序Reads数中circRNA的所占的比例(100×circRNA/(circRNA+mRNA))。从这一指标来看,体液样品中circRNA的占比显著高于组织样品。同一个基因来源的circRNA和mRNA,在体液中circRNA所占的比例显著高于组织样品。(PS:这个统计数据是基于样品中反向拼接Reads数大于100的样品做的统计)

图3  体液标本中circRNA占比高于组织样品 ([1])

微生物来源RNA的情况

一些体液中包含了很多微生物来源的RNA,包括粪便,汗液,唾液和痰液。其中微生物的小RNA比mRNA丰度更高。这与所取材料的特征有关。

图4  体液标本中微生物来源RNA情况 ([1])

组织/细胞特异性RNA对体液RNA的特异性关系

分析组织/细胞特异性mRNA与体液mRNA的对应关系,表明很多组织/细胞特异性的mRNA只在少数几种类型的体液标本中出现。总体而言,体液中的mRNA与分泌或输送该体液的组织或细胞有很大的相关性。进一步,作者基于已有的胰腺组织中单细胞测序数据,分析了10种细胞类型的marker基因在所测的胰腺囊肿液中mRNA的分布情况,进行了去卷积分析(deconvolution)。结果表明,两种胰腺囊肿液中mRNA来源的细胞类型有较大差别。这一结果按时体液中RNA的来源存在高度的多样性特征。

图5 体液RNA的组织来源分析 ([1])

体液RNA作为疾病标志物的潜力

本文中,作者分析了四种疾病的样本群(Case/Control cohort)。测序的数据显示, 慢性阻塞性肺疾病(COPD)患者的痰液总RNA显著高于对照组,可能与活跃的免疫反应有关。COPD标本相对于对照组有5513种mRNA上调,6种mRNA下调。其中CCL20是COPD痰液中上调最多的mRNA分子。ADA,MMP1上调也很显著,这些基因在COPD发病过程中有重要作用。膀胱癌患者和对照组的尿液中总RNA的丰度没有太大的变化,胶质母细胞瘤患者与脑积水患者的脑脊液中总RNA水平接近,没有明显的升高或降低趋势。尿液中,膀胱癌患者相对于对照组有529种mRNA上调,9种mRNA下调。其中几种上调的mRNA也曾有报道在尿液中存在,包括MDK,SLC2A1, GPRC5A,KRT17,KRT5。脑脊液中只有两种mRNA在胶质母细胞瘤中显著升高,其中CD163曾报道在胶质母细胞瘤进展中发挥作用。

图6  体液RNA作为疾病标志物的潜力 ([1])

参考文献

1. Hulstaert E, Morlion A, Avila Cobos F, …, Mestdagh P. Charting Extracellular Transcriptomes in The Human Biofluid RNA Atlas. Cell Rep. 2020 Dec 29;33(13):108552. doi: 10.1016/j.celrep.2020.108552. PMID: 33378673.

发表评论