...
首页> 外文期刊>ACM journal of data and information quality >Machine Reading of Biomedical Data Dictionaries
【24h】

Machine Reading of Biomedical Data Dictionaries

机译:机器读取生物医学数据词典

获取原文
获取原文并翻译 | 示例
           

摘要

This article describes an approach for the automated reading of biomedical data dictionaries. Automated reading is the process of extracting element details for each of the data elements from a data dictionary in a document format (such as PDF) to a completely structured representation. A structured representation is essential if the data dictionary metadata are to be used in applications such as data integration and also in evaluating the quality of the associated data. We present an approach and implemented solution for the problem, considering different formats of data dictionaries. We have a particular focus on the most challenging format with a machine-learning classification solution to the problem using conditional random field classifiers. We present an evaluation using several actual data dictionaries, demonstrating the effectiveness of our approach.
机译:本文介绍了一种方法,用于自动阅读生物医学数据词典。 自动读数是以文档格式(例如PDF)以完全结构化表示从数据字典中提取每个数据元素的元素细节的过程。 如果要在诸如数据集成的应用程序中使用数据字典元数据,并且还在评估相关数据的质量时,则结构化表示是必要的。 考虑到不同格式的数据词典,我们提出了一种方法并实现了解决方案。 我们特别关注最具挑战性的格式,使用条件随机现场分类器对问题进行机器学习分类解决方案。 我们使用几个实际数据词典提供评估,展示了我们方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号