首页> 中国专利> 一种基于知识图谱的智能制造行业供需匹配方法

一种基于知识图谱的智能制造行业供需匹配方法

摘要

本发明提供了一种基于知识图谱的智能制造行业供需匹配方法,实现对输入的需求数据输出数据库中匹配度最高的供应商列表。经实际测试,本发明可以实现对输入需求输出数据库中匹配度较高的供应商的预期效果。其中,本发明的技术方案通过使用基于专家知识的领域内行业、智能制造生命周期、智能制造系统层级、智能制造需求/服务类别四维度标签体系设计,在单纯的语料文本相似度的基础上,对需求与供应商的匹配在行业维度、智能化升级改造的生命周期、系统层级维度、及需求/服务类别维度进行了着重,使得模型输出的供应商同时考虑了需求所属行业与供应商服务行业、需求落点与供应商服务类别、需求落点对应的智能制造生命周期及系统层级等维度的匹配。

著录项

  • 公开/公告号CN112308672A

    专利类型发明专利

  • 公开/公告日2021-02-02

    原文格式PDF

  • 申请/专利权人 上海智能制造功能平台有限公司;

    申请/专利号CN202011208065.7

  • 发明设计人 梅军;谭李诺;王飞;陆俊敏;丁强;

    申请日2020-11-03

  • 分类号G06Q30/06(20120101);G06Q50/04(20120101);G06F16/28(20190101);G06F40/194(20200101);G06F40/284(20200101);G06N3/04(20060101);

  • 代理机构31001 上海申汇专利代理有限公司;

  • 代理人徐俊

  • 地址 201300 上海市浦东新区南汇新城镇环湖西二路888号C楼

  • 入库时间 2023-06-19 09:46:20

说明书

技术领域

本发明涉及一种基于知识图谱的制造行业供需匹配方法,适用于智能制造行业,属于知识图谱及供需匹配技术领域。

背景技术

知识图谱(Knowledgeable Graph,简称KG)技术基于图模型对知识进行建模与表示,并在此基础上通过图挖掘算法、知识推理算法等对知识进行挖掘与计算,从而服务于知识扩展、智能搜索、推荐匹配、决策辅助等上层应用。

近年来,知识图谱逐渐成为人工智能领域的研究重点与基础。工业界成熟的知识图谱及其上层应用典型的有:百度的通用知识图谱及基于其上的智能搜索服务、美团点评的生活娱乐领域知识图谱“美团大脑”及其服务的大众点评等应用、淘宝的电商知识图谱及基于其上建立的智能推荐应用、电力行业的电力知识图谱及基于其上的电力检修辅助应用、金融领域的创投知识图谱及基于其上的决策可视化支持应用等。

智能制造行业与产业领域知识图谱旨在汇总智能制造行业数据,提炼行业知识与共性技术,服务于智能制造系统解决方案上下游(供应商和制造企业)。而基于其上建立的基于知识图谱的供需匹配应用可为企业提出的需求推荐合适的供应商,提升企业智能化升级改造的效率。

然而,截至目前,国内尚未报道智能制造领域的行业及产业领域知识图谱研究成果,对制造业行业的供需匹配研究及应用则多集中于服务于云制造的资源调度类双边匹配等,对聚焦于智能化升级改造上下游的供需匹配相关研究及应用则较为欠缺。

发明内容

本发明的目的是:解决当前制造企业智能化改造过程中的效率与供应两大痛点,为行业企业实现资源赋能,推动智能制造行业与产业的深入变革。

为了达到上述目的,本发明的技术方案是提供了一种基于知识图谱的智能制造行业供需匹配方法,其特征在于,包括以下步骤:

步骤1、智能制造行业及产业领域知识图谱构建,包括以下步骤:

步骤101、构建基于专家知识的本体体系:基于专家知识,将智能制造领域知识图谱的本体体系抽象为一系列实体类型与关系类型;

步骤102、数据收集:围绕智能制造系统解决方案收集目前行业内与市场上的相关数据;

步骤103、属性计算,包括以下步骤:

步骤1031、建立基于自拟关键词表相似度的分类模型;

步骤1032、基于专家知识整理得到领域内行业分类体系,并对每一分类拟写带权重的关键词表,输入步骤1031得到的相似度分类模型获得行业标签模型;

步骤1033、基于专家知识整理得到智能制造需求/服务类别分类体系,并对每一分类拟写带权重的关键词表,输入步骤1031得到的相似度分类模型获得需求/服务类别标签模型;

步骤1034、基于专家知识整理得到智能制造生命周期分类体系,并对每一分类拟写带权重的关键词表,输入步骤1031得到的相似度分类模型获得智能制造生命周期标签模型;

步骤1035、基于专家知识整理得到智能制造系统层级分类体系,并对每一分类拟写带权重的关键词表,输入步骤1031得到的相似度分类模型获得智能制造系统层级标签模型;

步骤1036、使用步骤1032构建的行业标签模型、步骤1033构建的需求/服务类别标签模型、步骤1034构建的智能制造生命周期标签模型、步骤1035构建的智能制造系统层级标签模型对知识图谱中的供应商、方案实体进行行业、需求/服务类别、生命周期、系统层级四个维度的标签标注;

步骤1037、根据收集得到的信息完整度及抽取得到的供应商-协会关系数据,计算得到供应商初始权重数据;

步骤104、关系抽取:通过元数据整理及基于文本规则构建关系抽取模型,提取数据中存在的(实体-关系-实体)三元组;

步骤105、知识图谱存储层与数据层构建:知识图谱存储层采用neo4j图数据库存储实体间关系数据,采用mysql数据库存储实体属性数据;将收集的数据、计算得到的标签存入mysql数据库,将整理与抽取的关系存入neo4j数据库,完成知识图谱数据层的构建;

步骤2、供需匹配度计算,包括以下步骤:

步骤201、数据字段分类与整合:选取需求数据的名称、行业、技术分类、简介、详情、需求分类字段,方案数据的名称、标签、行业分类、功能分类、技术分类、产品分类、简介、详情字段,供应商数据的名称、主营产品、简介、服务类别、客户行业、详情、方案名称列表字段,各按照一定的权重进行整合,得到相应的文本语料;

步骤202、使用构建知识图谱时建立的行业标签模型、需求/服务类别标签模型、智能制造生命周期标签模型、智能制造系统层级标签模型对需求数据进行业、需求/服务类别、生命周期、系统层级四个维度的标签标注;

步骤203、建立基于分词与词频的文本相似度计算模型;

步骤204、建立基于标签集合的标签相似度计算模型;

步骤205、加权计分与排序,包括以下步骤:

步骤2051、将待匹配的需求数据与方案数据库中的所有数据逐条计算文本相似度、标签相似度,按照拟定的权重加权平均后,得到方案匹配度分值表,其中,标签相似度包括行业标签相似度、智能制造生命周期、系统层级、需求/服务类别标签相似度;

步骤2052、提取数据库中的(供应商-拥有方案-方案)关系,对数据库中的所有供应商,提取其包含方案中最大匹配度,作为供应商方案维度的匹配分值;

步骤2053、将待匹配的需求数据与供应商数据库中的所有数据逐条计算文本相似度、标签相似度,与步骤2052得到的供应商方案维度的匹配分值一起按照拟定的权重加权平均后,得到供应商原始匹配度分值表,其中,标签相似度包括行业标签相似度、智能制造生命周期、系统层级、需求/服务类别标签相似度;

步骤2054、提取数据库中计算得到的供应商初始权重数据,进行Sigmoid归一化处理后,乘入步骤2053计算得到的供应商原始匹配度分值表中的供应商原始匹配度分值,得到供应商匹配度分值,进行排序,并按照应用需求取供应商匹配度分值排在前K位的供应商进行输出,K≥1。

优选地,步骤101中,所述实体类型包括供应商、解决方案、产品、案例、协会、政策、标准、需求;

所述关系类型包括供应商-拥有方案-方案、供应商-拥有产品-产品、方案-拥有案例-案例。

优选地,步骤102中,所述相关数据包括解决方案、方案案例、方案供应商、供应商产品、供应商协会等,并收集行业相关政策、标准、需求数据。

优选地,步骤104中,所述(实体-关系-实体)三元组包括(供应商-拥有方案-方案)、(供应商-拥有产品-产品)、(方案-拥有案例-案例)、(协会-包含供应商-供应商)。

优选地,步骤203中,所述文本相似度计算模型使用向量间欧式距离计算相似度。

优选地,步骤204中,所述标签相似度计算模型使用集合间Jaccard距离计算相似度。

本发明提供了一种行之有效的基于智能制造行业资源知识图谱的供需匹配方法,实现对输入的需求数据输出数据库中匹配度最高的供应商列表。经实际测试,本发明可以实现对输入需求输出数据库中匹配度较高的供应商的预期效果。其中,本发明的技术方案通过使用基于专家知识的领域内行业、智能制造生命周期、智能制造系统层级、智能制造需求/服务类别四维度标签体系设计,在单纯的语料文本相似度的基础上,对需求与供应商的匹配在行业维度、智能化升级改造的生命周期、系统层级维度、及需求/服务类别维度进行了着重,使得模型输出的供应商同时考虑了需求所属行业与供应商服务行业、需求落点与供应商服务类别、需求落点对应的智能制造生命周期及系统层级等维度的匹配,更加符合用户预期。

附图说明

图1为智能制造行业及产业领域知识图谱构建流程图;

图2为供需匹配度计算流程图;

图3为基于专家知识构建的本体体系示意图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明提供的一种基于知识图谱的智能制造行业供需匹配方法,步骤为:

步骤1、基于专家知识构建本体体系,如图1所示;

步骤2、基于专家知识整理得到领域内行业分类体系及相关关键词表,如下表1所示;

表1基于专家知识整理得到领域内行业分类体系及相关关键词表

步骤3、基于专家知识整理得到智能制造生命周期分类体系及相关关键词表,如下表2所示;

表2基于专家知识整理得到智能制造生命周期分类体系及相关关键词表

步骤4、基于专家知识整理得到智能制造系统层级分类体系及相关关键词表,如下表3所示;

表3基于专家知识整理得到智能制造系统层级分类体系及相关关键词表

步骤5、基于专家知识整理得到智能制造需求/服务分类体系及相关关键词表,如下表4所示;

表4基于专家知识整理得到智能制造需求/服务分类体系及相关关键词表

步骤6、建立基于自拟关键词表的文本相似度分类模型,将上述的领域内行业分类体系及相关关键词表、智能制造生命周期分类体系及相关关键词表、智能制造系统层级分类体系及相关关键词表以及智能制造需求/服务分类体系及相关关键词表输入文本相似度分类模型得到相关维度的标签模型;

步骤7、根据梳理得到的本体体系,收集各类实体、关系数据,存入mysql数据库;

步骤8、对供应商实体及方案实体,利用标签模型进行行业、需求/服务类别、生命周期、系统层级这四个维度的标签计算,得到前述四个维度的属性数据,存入mysql数据库;

步骤9、根据收集得到的信息完整度及抽取得到的供应商-协会等关系数据,计算得到供应商初始权重数据;

步骤10、通过元数据整理及基于文本规则构建关系抽取模型,提取数据中存在的(供应商-拥有方案-方案)、(供应商-拥有产品-产品)、(方案-拥有案例-案例)、(协会-包含供应商-供应商)等(实体-关系-实体)三元组,存入neo4j数据库。其中,元数据即数据收集过程中的形如“方案-所属供应商”的结构化数据,文本规则则形如“xxx公司提供的xxx方案”、“xxx公司隶属于xxx协会”等;

步骤11、选取数据库中收录的待匹配需求数据的名称、行业、技术分类、简介、详情、需求分类字段,按照一定的权重进行整合,得到相应的文本语料;

步骤12、将上一步得到的文本语料输入构建知识图谱时建立的标签模型,得到行业、需求/服务类别、生命周期、系统层级这四个维度的标签标注;

步骤13、对数据库中的所有方案、供应商实体,选取方案数据的名称、标签、行业分类、功能分类、技术分类、产品分类、简介、详情字段,供应商数据的名称、主营产品、简介、服务类别、客户行业、详情、方案名称列表字段,各按照一定的权重进行整合,得到相应的文本语料;

步骤14、建立基于分词与词频的文本相似度计算模型,该文本相似度计算模型使用向量间欧式距离计算相似度;将步骤11、步骤13处理得到的语料数据输入该文本相似度计算模型,计算得到待匹配需求与数据库中所有方案、待匹配需求与数据库中所有供应商各自的文本相似度;

步骤15、建立基于标签集合的标签相似度计算模型,该标签相似度计算模型使用集合间Jaccard距离计算相似度;将步骤12得到的、数据库中的标签数据输入该标签相似度计算模型,计算得到待匹配需求与数据库中所有方案、待匹配需求与数据库中所有供应商各自的行业、智能制造生命周期、智能制造系统层级、需求/服务类别这四个维度的标签相似度;

步骤16、对需求-方案数据,计算文本相似度与四个维度的标签相似度的加权平均值,得到待匹配需求与每一方案的匹配度;

步骤17、提取数据库中的(供应商-拥有方案-方案)关系,对数据库中的所有供应商,提取其包含方案中最大匹配度,作为供应商方案匹配度;

步骤18、对需求-供应商数据,计算方案匹配度、文本相似度与四个维度的标签相似度的加权平均值,得到待匹配需求与每一供应商的原始匹配度;

步骤19、提取数据库中计算得到的供应商初始权重数据,进行Sigmoid归一化处理后,乘入上一步计算得到的供应商原始匹配度分值,得到最终的供应商匹配度。其中,Sigmoid归一化公式Sigmoid(x)为:

步骤20、将上一步得到的供应商匹配度从大到小进行排序,并按照应用需求取前五项进行最终匹配结果的输出。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号