首页> 外文会议>2014 IEEE/ACM Joint Conference on Digital Libraries >Crowd-sourcing Web knowledge for metadata extraction
【24h】

Crowd-sourcing Web knowledge for metadata extraction

机译:众包Web知识以进行元数据提取

获取原文
获取原文并翻译 | 示例

摘要

We explore a new metadata extraction framework without human annotators with the ground truth harvested from Web. A new training sample is selected based on not only the uncertainty and representativeness in the unlabeled pool, but also on its availability and credibility in Web knowledge bases. We construct a dataset of 4329 books with valid metadata and evaluate our approach using 5 Web book databases as oracles. Empirical results demonstrate its effectiveness and efficiency.
机译:我们探索了一个新的元数据提取框架,该框架没有人工注释者,而是从Web上收集了基本事实。选择新的培训样本不仅基于未标记池中的不确定性和代表性,还基于其在Web知识库中的可用性和信誉。我们使用有效的元数据构建4329本书的数据集,并使用5个Web图书数据库作为oracle评估我们的方法。实证结果证明了其有效性和效率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号