首页> 外文会议>2014 IEEE International Conference on Security, Pattern Analysis, and Cybernetics >Semantic-based intelligent data clean framework for big data
【24h】

Semantic-based intelligent data clean framework for big data

机译:基于语义的大数据智能数据清理框架

获取原文
获取原文并翻译 | 示例

摘要

In order to overcome the limitation of existing data cleansing methods working on massive data, in this paper, we propose a generic semantic-based framework using parallelized processing model for effective big data cleansing. We also use an improved Semantic-Based Keyword Matching Algorithm to deal with duplicate data. Experimental results show that this parallelized framework with improved Semantic-Based Keyword Matching Algorithm can identify duplicates with high recall and precision and have a good performance for big data cleansing.
机译:为了克服现有的处理海量数据的数据清理方法的局限性,本文提出了一种基于语义的通用框架,该框架使用并行处理模型进行有效的大数据清理。我们还使用一种改进的基于语义的关键字匹配算法来处理重复数据。实验结果表明,该并行框架具有改进的基于语义的关键字匹配算法,能够以较高的查全率和准确性来识别重复项,并具有良好的大数据清理性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号