全基因组关联分析(GWAS)虽然指出了成千上万的致病位点,但尴尬的是,超过90%的信号都落在了非编码区[1]。面对这片“基因荒漠”,如果非要硬把线索“安”在隔壁的编码基因头上,传统的科研直觉往往会“碰壁”。
近日,西湖大学杨剑研究员团队在Cell Press旗下期刊The American Journal of Human Genetics发表重磅研究,并一举登上Cell Press官网头条:Genetic control of non-coding RNAs in the human brain and their implications for complex traits。
研究揭示了一个长期被低估的事实:
大脑复杂性状的“隐形推手”,往往是那些被传统测序策略忽略的ncRNA。
因此,一个更现实的问题是:在现有的实验与分析流程下,这类ncRNA信号是否会被系统性低估甚至漏检?
01 顶刊提示:ncRNA的注释缺口可能被低估
该研究基于2865例脑组织数据,构建ncRNA遗传图谱,并观察到明显的注释缺失:
① 鉴定出的lncRNA 中,>70%未被GENCODE注释;circRNA几乎全部位于既有注释范围外。
② ncRNA的eQTL与邻近mRNA的关联并非必然;有72个GWAS信号表现为主要通过lncRNA介导。
③ ncRNA可独立解释约11%的性状遗传力。
该结果在一定程度上依赖Total RNA路线;若沿用常规Poly(A)捕获,部分ncRNA 信号可能难以检测。但即便在bulk层面捕捉到了这些信号,机制层面仍有个现实问题:
bulk看到的是“平均值”,但机制要回答的是“谁在做事”。同一个ncRNA,到底是在兴奋性神经元起作用,还是胶质细胞?
因此我们需要在单细胞层面看清ncRNA/全转录组信号,但主流单细胞流程(尤其是依赖Poly(A)/3’捕获的方法)对这类信号覆盖不足——部分信号在捕获阶段即被过滤。
图1 研究总体概述[2]
02 技术瓶颈:传统单细胞测序为什么不够用
目前主流的标准单细胞测序(如基于10×3’端捕获)高度依赖Oligo(dT)引物抓取Poly(A)尾,面对上述的前沿研究需求,这种策略就明显不够用:
本质抓不到:研究中强调的circRNA(环状,无尾巴)和大量non-poly(A)lncRNA,会被Oligo(dT)引物直接过滤掉。
信息不够全:3’端策略不利于isoform/剪接解析;而变异检出一般只能作为候选线索,可靠性高度依赖覆盖与深度。
样本受限:严重依赖RNA 3’端完整性。对于临床冻存或降解样本(如脑库组织),一旦3’端受损,建库失败概率就很高。
想把顶刊里那种ncRNA线索在单细胞层面讲清楚,光靠传统3’单细胞这套“老工具”往往不够——你需要的是能尽量还原Total RNA视野的测序路线。
03 吉赛生物方案:单细胞全转录组
面向非编码RNA研究需求,吉赛生物基于SeekOne®数字液滴平台提供单细胞全转录组方案,采用“随机引物 + rRNA 去除”,将non-poly(A)转录本纳入检测范围,降低捕获策略带来的漏检风险。
图2 单细胞全转录组测序技术原理
技术特点1 全转录组覆盖更完整,减少non-poly(A)盲区
基于随机引物建库(配合rRNA去除),可在一次测序中同时覆盖 non-poly(A) RNA、circRNA,以及部分细胞内微生物RNA信号,获得更完整的转录组信息,包括:
circRNA捕获与解析:支持单细胞分辨率的识别与定量,用于构建不同细胞类型/状态的 circRNA 图谱。
non-poly(A) lncRNA 检出增强:增强检出与覆盖,降低Poly(A)/3’路线对关键调控分子的漏检风险。
宿主-微生物RNA同步检测:无需Poly(A)富集,可能同时获得宿主与病毒/细菌等微生物RNA,为互作分析提供输入。
技术特点2 全长信息,便于深入解析转录本机制
针对大量未注释转录本,我们结合随机引物与双端测序(Read1/Read2),获取不局限于3’端的序列信息,以支持:
新转录本发现:识别未注释lncRNA/转录本片段,补充现有注释集。
可变剪接分析:解析 isoform 差异及其在不同细胞类型/状态下的表达。
突变检测:视样本与深度而定,用于候选 SNV/Indel 的检出与追踪,为后续验证提供依据。
技术特点3 更适配降解样本,提升临床/脑库组织可用性
脑库或临床冻存组织常因存储/处理差异出现RNA降解。随机引物建库不强依赖3’端完整性,即使部分降解仍可捕获残留片段并测序,从而降低3’端受损导致的漏检风险,使部分原本难以上机的样本也能获得可用数据。
实测数据显示,吉赛单细胞全转录组在不同样本中,均能实现circRNA的精准检出,并大幅提高lncRNA检出率。
技术特点4 配套生信分析,把ncRNA结果“落到论文里”
很多项目的难点不在测序,而在于把circRNA/lncRNA的发现转化为可发表的结果。基于单细胞全转录组数据,我们提供ncRNA分析链路,常用模块包括:
表达与图谱:按细胞类型/状态做circRNA、lncRNA表达矩阵与聚类结果,筛选标记分子。
调控推断:构建ncRNA–mRNA共表达网络,预测潜在靶基因与调控关系。
变异与剪接:在覆盖与深度允许时,汇总候选 SNV,并统计可变剪接事件。
结语
这篇研究的启示在于,许多关键调控因子并不一定存在于“注释最全”的基因组区域,而是在我们过去研究流程里最容易漏掉的ncRNA信号里。对于涉及ncRNA、脑组织或病原相关样本的研究,单细胞全转录组技术可以更有效地捕捉这些关键信号,帮助我们挖掘更多潜在的重要信息。
如果你也在做类似样本或关注ncRNA相关信号,后续想把路线、测序深度和分析策略落到具体项目上,我们可以结合你的研究问题一起细化。
参考文献:
1.Maurano, M. T. et al. Systematic localization of common disease-associated variation in regulatory DNA. Science 337, 1190–1195 (2012).
2.Chen, L. et al. Genetic control of non-coding RNAs in the human brain and their implications for complex traits. The American Journal of Human Genetics (2025) doi:10.1016/j.ajhg.2025.11.012.
原文链接:
https://www.cell.com/ajhg/fulltext/S0002-9297(25)00437-9?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0002929725004379%3Fshowall%3Dtrue
.png)