首页> 中文会议>第33届中国数据库学术会议(NDBC2016 ) >基于多级空间值的真值发现算法

基于多级空间值的真值发现算法

摘要

不同web数据源的可靠性存在差异,导致不同数据源描述同一个实体属性的数据值可能存在冲突.已有解决数据冲突的方法均把数据项值作为一个整体考虑,忽略了每级值之间的差异性和独立性,降低了真值发现的准确率.针对这种现象,本文提出了一种专门处理多级空间值的基于贝叶斯分析的真值发现算法.结合级与级之间的差异性和独立性,将数据项值进行分级处理,并基于分级计算的vote值选出真实值;根据来源提供值的多级信息与真实值的相似度计算来源准确率,进行新一轮的迭代.最后,通过在真实数据集和人工数据集上的实验说明了本文算法能有效地提高真值发现的准确率和计算效率.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号