首页> 外文会议>Biomedical NLP workshop 2017 >Document retrieval and question answering in medical documents. A large-scale corpus challenge.
【24h】

Document retrieval and question answering in medical documents. A large-scale corpus challenge.

机译:医学文档中的文档检索和问题解答。大规模的语料库挑战。

获取原文
获取原文并翻译 | 示例

摘要

Whenever employed on large datasets, information retrieval works by isolating a subset of documents from the larger dataset and then proceeding with low-level processing of the text. This is usually carried out by means of adding index-terms to each document in the collection. In this paper we deal with automatic document classification and index-term detection applied on large-scale medical corpora. In our methodology we employ a linear classifier and we test our results on the BioASQ training corpora, which is a collection of 12 million MeSH-indexed medical abstracts. We cover both term-indexing, result retrieval and result ranking based on distributed word representations.
机译:每当用于大型数据集时,信息检索都通过从较大的数据集中隔离文档的子集,然后进行文本的低级处理来进行。这通常是通过向集合中的每个文档添加索引词来实现的。在本文中,我们处理应用于大型医疗语料库的自动文档分类和索引项检测。在我们的方法中,我们使用线性分类器,然后在BioASQ训练语料库上测试结果,该资料集是由1200万个MeSH索引的医学摘要组成的。我们涵盖了基于分布式单词表示的术语索引,结果检索和结果排名。

著录项

  • 来源
  • 会议地点 Varna(BG)
  • 作者

    Eric Curea;

  • 作者单位

    Research Institute for Artificial Intelligence "MIHAI DRAGANESCU", Romanian Academy;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

  • 入库时间 2022-08-26 14:02:32

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号