首页> 美国卫生研究院文献>Nucleic Acids Research >OpenProt: a more comprehensive guide to explore eukaryotic coding potential and proteomes
【2h】

OpenProt: a more comprehensive guide to explore eukaryotic coding potential and proteomes

机译:OpenProt:探索真核编码潜力和蛋白质组的更全面指南

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Advances in proteomics and sequencing have highlighted many non-annotated open reading frames (ORFs) in eukaryotic genomes. Genome annotations, cornerstones of today's research, mostly rely on protein prior knowledge and on ab initio prediction algorithms. Such algorithms notably enforce an arbitrary criterion of one coding sequence (CDS) per transcript, leading to a substantial underestimation of the coding potential of eukaryotes. Here, we present OpenProt, the first database fully endorsing a polycistronic model of eukaryotic genomes to date. OpenProt contains all possible ORFs longer than 30 codons across 10 species, and cumulates supporting evidence such as protein conservation, translation and expression. OpenProt annotates all known proteins (RefProts), novel predicted isoforms (Isoforms) and novel predicted proteins from alternative ORFs (AltProts). It incorporates cutting-edge algorithms to evaluate protein orthology and re-interrogate publicly available ribosome profiling and mass spectrometry datasets, supporting the annotation of thousands of predicted ORFs. The constantly growing database currently cumulates evidence from 87 ribosome profiling and 114 mass spectrometry studies from several species, tissues and cell lines. All data is freely available and downloadable from a web platform () supporting a genome browser and advanced queries for each species. Thus, OpenProt enables a more comprehensive landscape of eukaryotic genomes’ coding potential.
机译:蛋白质组学和测序技术的进步突出了真核生物基因组中的许多非注释性开放阅读框(ORF)。基因组注释是当今研究的基石,主要依靠蛋白质的先验知识和从头算预测算法。这样的算法尤其是对每个转录本强制采用一个编码序列(CDS)的任意标准,从而导致对真核生物编码潜力的严重低估。在这里,我们介绍OpenProt,这是迄今为止第一个完全支持真核基因组多顺反子模型的数据库。 OpenProt包含10个物种中超过30个密码子的所有可能的ORF,并累积了支持性证据,例如蛋白质保守性,翻译和表达。 OpenProt注释所有已知的蛋白质(RefProts),新的预测同工型(Isoforms)和来自替代ORF(AltProts)的新的预测蛋白。它结合了最先进的算法来评估蛋白质的正交性,并重新审理公开可用的核糖体谱和质谱数据集,从而支持对数千个预测的ORF的注释。这个不断增长的数据库目前收集了来自多个物种,组织和细胞系的87个核糖体谱分析和114个质谱研究的证据。所有数据均可从支持基因组浏览器和每个物种高级查询的Web平台上免费获得和下载。因此,OpenProt可以使真核基因组编码潜力的更全面的认识。

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号