近日,东南大学医学院王丽虹和南京航空航天大学姜伟、宋晓峰教授为共同通讯作者发表一个专门收集ncRNA编码的蛋白质或多肽的数据库——ncEP,文章发表在Journal Of Molecular Biology杂志上。ncRNA可以参与许多生物学过程,例如细胞生长,发育,代谢,死亡等。最初,这些ncRNA仅被视为“非翻译” RNA。近来,越来越多的证据表明,诸如lncRNA,circRNA和miRNA等非编码RNA(ncRNA)可以编码蛋白质或肽,其通常少于100个氨基酸。目前研究者已经提出了几种高通量预测ncRNA编码的蛋白质或肽的方法。但是,缺乏一套标准的ncRNA编码蛋白或肽的金标准,因为低通量的经过实验验证的肽散布在大量文献中,而没有系统的记录。ncEP数据库创建者希望专门为ncRNA编码的蛋白质或肽而精心设计的数据库,可以丰富ncRNA翻译的知识。

ncEP数据库包含来自已发表文章的,由ncRNA编码的低通量实验验证蛋白或肽。每个条目均包含有关蛋白质或肽名称,实验物种,染色体位置,蛋白质或肽序列,蛋白质或肽长度,ncRNA类型,ncRNA名称,实验技术,实验样品(细胞系和/或组织),亚细胞位置的详细信息,蛋白质或多肽功能,参考信息(PubMed ID,出版年份,论文标题)等。ncEP共包括80个条目,其中包括来自50多种论文的18种物种的22个lncRNA,9个circRNA,9个pri-miRNA和37个其他非编码RNA编码的蛋白质或肽。此外,ncEP提供了一个在线基因组浏览器,以显示ncRNA,蛋白质或肽的基因组位置及其物种保守性。

IMG_256

ncEP数据库提供了多种检索途径,可以通过蛋白/多肽名称或ncRNA名称进行搜索还可以按基因组位置进行搜索。

IMG_256

IMG_256

按基因组位置搜索。您可以通过基因组位置查询蛋白质或多肽。首先,您可以从物种下拉列表中选择物种,例如“人类Homo sapiens”。然后,从染色体下拉列表中选择染色体编号,例如“ 4”。接下来,您应该在查询文本框中输入基因组起始位点(例如“ 152321585”)和终止位点(例如“ 164899063”),然后按“搜索”按钮。结果列出了与您输入的“人类(人类)”,“ 4”,“ 152321585”和“ 164899063”相关的所有潜在条目。返回有关蛋白质或肽和ncRNA的基本信息。

IMG_256

IMG_256

ncEP还集成了一个在线基因组浏览器,用于可视化蛋白质或肽,ncRNA和物种保守性信息的基因组位置。ncRNA,肽和物种保护信息在基因组浏览器中显示为三个独立的轨道。如果您不知道蛋白质,肽或ncRNA的名称,也可以根据ncEP在基因组浏览器中的基因组位置进行搜索。

IMG_256

ncEP数据库网址:www.jianglab.cn/ncEP/

参考文献:Liu H, Zhou X, Yuan M, et al. ncEP: a manually curated database for experimentally validated ncRNA-encoded proteins or peptides[J]. Journal of Molecular Biology, 2020.

 

发表评论