首页> 中国专利> 基于无监督学习聚类算法的数据空间异构数据自动化融合的方法

基于无监督学习聚类算法的数据空间异构数据自动化融合的方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及数据集成技术领域，公开了基于无监督学习聚类算法的数据空间异构数据自动化融合的方法，包括以下步骤：S1.对异构数据进行预处理；S2.进行模式抽取，获取异构数据的属性名和属性值；S3.通过语料对词嵌入模块进行预训练；S4.将属性名输入预训练后的词嵌入模块，并得到属性名向量；S5.判断源模式与目标模式是否一致，若一致则进行下一步，若不一致则将属性值输入混合匹配器中，并计算属性值的源模式与目标模式之间的相似度，判断源模式与目标模式是否匹配，若匹配则进行下一步；S6.根据属性名向量，通过无监督学习聚类算法进行聚类集成。本发明解决了现有技术没有考虑属性名异构同义的情况，匹配的精确度无法保证，并且也无法解决值数据冲突的问题。

著录项

公开/公告号CN114741510A

专利类型发明专利
公开/公告日2022-07-12

原文格式PDF
申请/专利权人中山大学;
展开▼

申请/专利号CN202210357042.5
发明设计人孙伟;沈光明;
展开▼

申请日2022-04-06
分类号G06F16/35;G06F16/33;G06K9/62;G06N3/08;
代理机构广州粤高专利商标代理有限公司;
代理人刘俊
地址 510275 广东省广州市海珠区新港西路135号
入库时间 2023-06-19 15:58:43

法律信息

法律状态公告日

法律状态信息

法律状态
2022-07-12

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 基于模糊C均值聚类算法的多源异构数据融合方法及系统 [P] . 中国专利： CN114330598A . 2022-04-12
2. 一种基于虚实融合的数据空间构建方法及标识解析方法 [P] . 中国专利： CN112256728B . 2022.06.28
3. 一种基于变分自编码器的训练样本数据扩充方法、存储介质及计算机设备 [P] . 世界知识产权组织专利： WO2020/143321A1 . 2020.07.16
4. 下行数据发送方法、接收方法、装置和存储介质 [P] . 世界知识产权组织专利： WO2020/142911A1 . 2020.07.16
5. 一种基于动态视觉传感器的角点检测方法 [P] . 世界知识产权组织专利： WO2020/143499A1 . 2020.07.16