首页> 中文期刊> 《数据挖掘》 >一种基于实例的数据转换方法

一种基于实例的数据转换方法

         

摘要

Web中包含大量有用的信息,但由于它们是半结构化的,非专家用户在进行数据转换和集成时不能很好地利用。为此本文提出了一种基于实例的数据转换方法,用户只需要提供适当的输入–输出示例就可以得到所需的转换。首先,利用基于序列比对的模式距离度量方法依据用户提供的示例生成代表性示例;其次,提出了一种基于信息熵的代码分析方法,利用该方法与代表性示例结合来筛选与转换任务相关的候选函数;最后,通过函数排名将相关函数先进行列转换,再行合成与所有示例一致的数据转换程序。本文利用房地产领域数据集进行了实验评估,结果表明,该方法可以处理目前许多现有系统不支持的常见转换,并且能够实现实验系统中近80%的数据转换,其准确率远高于其他同类型系统。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号