首页> 中国专利> 一种智能招投标信息契合方法

一种智能招投标信息契合方法

摘要

本发明公开了一种智能招投标信息契合方法,旨在解决现有技术中人工搜集招标信息成本高、准确率低的技术问题。其包括:通过爬虫程序获取招标信息;利用智能招投标信息契合模型将招标信息与预先构建的数据库匹配,得到与招标信息相匹配的产品信息,其中,预先构建的数据库包括产品信息库和产品标签库;将匹配成功的招标信息和产品信息推送给投标负责人。本发明能够自动搜集、匹配招投标信息,进而提高招投标信息推送精准度,实现自动化、智能化的招投标信息契合。

著录项

  • 公开/公告号CN114925260A

    专利类型发明专利

  • 公开/公告日2022-08-19

    原文格式PDF

  • 申请/专利权人 南瑞集团有限公司;

    申请/专利号CN202210596939.3

  • 申请日2022-05-30

  • 分类号G06F16/951(2019.01);G06F16/33(2019.01);G06F40/216(2020.01);G06F40/289(2020.01);G06Q30/02(2012.01);G06Q30/08(2012.01);

  • 代理机构南京纵横知识产权代理有限公司 32224;

  • 代理人董建林

  • 地址 210003 江苏省南京市鼓楼区南瑞路8号

  • 入库时间 2023-06-19 16:26:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-06

    实质审查的生效 IPC(主分类):G06F16/951 专利申请号:2022105969393 申请日:20220530

    实质审查的生效

说明书

技术领域

本发明涉及一种智能招投标信息契合方法,属于营销客户服务技术领域。

背景技术

客户服务契合度是企业与客户建立一种深层次的联系,围绕客户服务场景,以“触点”为核心,贯彻客户服务售前、售中与售后的客户服务全过程。客户服务契合度基于客户自身诉求与企业的服务响应,构建客户服务生态圈,强调客户价值认知与行为、结果的融合,包含客户对企业和品牌的忠诚与承诺等情感联结,更包含企业与客户角度的价值创造含义。高契合度的客户服务核心在于企业产品和服务最佳化支撑客户业务,既满足客户的业务价值,也为企业创造利润,形成共赢和良性循环。

为客户提供高契合度服务的首要前提是精准识别客户需求,获取招标公告是了解客户需求的重要环节,基于企业自身的产品与服务能力判断能否为客户提供相应的服务,再决定是否参与投标。目前大多数企业依靠人工到互联网上搜集招标信息,识别判断后派发给下属单位和营销人员,不仅耗费大量的人力物力,还可能漏标,错失签约。以某大型央企为例,其在售的产品与服务涉及电网、信通、工业、电气、发电等业务板块,合计一千多款产品,对营销人员的专业能力要求很高。

目前市面上也有通过程序自动化采集和推送互联网公开数据的技术,但是这些技术只能实现简单数据的采集推送,对采集到的招标公告数据未进行深层次的解析,未与产品关联,导致招投标信息匹配准确度差,推送精准度低,缺乏实用性。

发明内容

为了解决现有技术中人工搜集招标信息成本高、准确率低的问题,本发明提出了一种智能招投标信息契合方法,从多个维度采集、分析客户招标信息,利用机器学习算法匹配与招标信息对应的产品信息,实现自动化、智能化的招投标信息契合。

为解决上述技术问题,本发明采用了如下技术手段:

本发明提出了一种智能招投标信息契合方法,包括如下步骤:

通过爬虫程序获取招标信息;

利用智能招投标信息契合模型将招标信息与预先构建的数据库匹配,得到与招标信息相匹配的产品信息,其中,预先构建的数据库包括产品信息库和产品标签库;

将匹配成功的招标信息和产品信息推送给投标负责人。

进一步的,通过爬虫程序获取招标信息的方法为:

通过爬虫程序从招标网站获取招标公告;

对招标公告进行解析,得到招标产品范围、资质要求和招标相关的非结构化信息,生成格式化的招标信息,其中,招标信息包括分标编号、包名称、分包编号、项目单位、需求单位、项目名称、项目内容、物资名称和物资描述。

进一步的,基于Python编写爬虫程序,通过企业数据中心的任务调度服务对爬虫进行任务调度;爬虫程序采用手工触发或定时触发。

进一步的,所述利用智能招投标信息契合模型将招标信息与预先构建的数据库匹配包括:精准匹配和宽松匹配。

进一步的,所述产品信息库基于Elasticsearch存储多个产品信息,产品信息包括产品名称、产品描述、产品分类;所述产品标签库存储多个产品标签,产品标签采用产品信息、产品信息的相似词、近义词或关系密切词,同一个产品的产品标签存在关联;

所述产品标签库的构建方法为:

基于产品信息库中的产品信息和历史招标信息组合成基础数据集;

通过机器学习算法对基础数据集进行数据清洗、数据分割,得到基础关键词;

根据基础关键词训练词向量模型,计算相似词、近义词与关系密切词,为产品打标签,得到产品标签库。

进一步的,精准匹配的方法为:

通过分词器对招标信息进行分词;

将分词结果与产品信息库中的产品信息进行全词匹配检索,当任一产品信息与分词结果相同时,匹配成功,输出匹配成功的产品信息,否则,匹配失败。

进一步的,宽松匹配的方法为:

通过TextRank计算出招标信息的招标关键词;

将招标关键词与产品标签库中的产品标签进行全词匹配检索,当任一产品标签与招标关键词相同时,匹配成功,输出匹配成功的产品标签对应的产品信息,否则,匹配失败。

进一步的,当一个招标信息与多个产品信息匹配成功时,按照匹配度对多个产品信息进行排序,其中,一个招标关键词与产品信息库中任一产品信息相同或与产品标签库中任一产品标签相同,则匹配成功一次,匹配度=匹配成功次数/总匹配次数*100%。

进一步的,智能招投标信息契合模型配置有Rest API,通过Rest API与第三方系统集成调用,便于共享、应用招标信息和产品信息。

进一步的,将匹配成功的招标信息和产品信息按照预设文本格式以短信、邮件的方式推送给投标负责人。

采用以上技术手段后可以获得以下优势:

本发明提出了一种智能招投标信息契合方法,通过爬虫程序批量化、自动化获取招标信息,然后基于机器学习算法,分别从精准匹配和宽松匹配的维度对招标信息和产品信息、产品标签进行匹配,得到与招标信息匹配的产品信息,并进行信息推送。本发明方法能够对采集到的招标公告数据进行深层次的解析,可以有效提高招投标信息的匹配准确度,进而提高推送精准度,实现自动化、智能化的招投标信息契合。

本发明方法强化了客户招标信息(需求)与企业产品功能及服务能力的智能化衔接管理,使用智能数据分析技术提高客户服务契合水平,进而为客户提供精准靶向服务,为企业与客户创造价值。

附图说明

图1为本发明一种智能招投标信息契合方法的一种实施例步骤流程图;

图2为本发明实施例中产品标签库的构建方法的步骤流程图;

图3为本发明实施例中招标关键词和相似词个数与匹配成功次数之间的关系示意图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明:

实施例1:

本发明提出了一种智能招投标信息契合方法,如图1所示,主要包括如下步骤:

步骤A、通过爬虫程序获取招标信息,其中,招标网站主要包括企业级电子商务平台、企业级供应链统一服务平台以及其他相关行业招投标网站。

步骤A01、基于Python编写用于采集招标信息的爬虫程序,通过企业数据中心的任务调度服务对爬虫进行任务调度,在本发明实施例中,爬虫程序可以采用手工触发,也可以在指定时段内定时触发。通过爬虫程序可以从招标网站上批量化、自动化采集招标公告。

步骤A02、在招标公告中存在大量冗余数据,对招投标信息契合匹配没有价值,因此本发明需要对招标公告进行解析,去除冗余数据,得到招标产品范围、资质要求和招标相关的非结构化信息,生成格式化的招标信息。数据解析方法为:确定关键字段,从关键字段的开头开始截取文本内容,遇到第一个标点符号后停止。比如要从招标公告中提取 “物资名称”关键字段,则从头开始截取物资名称的文本内容,遇到第一个英文逗号停止,可以得到准确的不带参数的物资名称(英文逗号之后开始均为物资参数),如果截取到多个同样的物资名称,则保留一条物资名称数据。

招标信息包括分标编号、包名称、分包编号、项目单位、需求单位、项目名称、项目内容、物资名称和物资描述等内容。以物资类招标公告为例,通过“物资名称”和“物资描述”两个关键字段,可以明确客户发包的需求物资。

步骤B、利用智能招投标信息契合模型将招标信息与预先构建的数据库匹配,得到与招标信息相匹配的产品信息。

在步骤B中,根据企业涵盖的产品、服务构建数据库,数据库包括产品信息库和产品标签库,产品信息库基于Elasticsearch存储多个产品信息,每个产品信息包括产品名称、产品描述、产品分类等内容;产品标签库存储多个产品标签,产品标签采用产品信息、产品信息的相似词、近义词或关系密切词,同一个产品的多个产品标签之间存在关联,即可以根据任一产品标签查找到产品信息。

如图2所示,产品标签库的构建方法包括如下步骤:

(1)基于产品信息库中的产品信息和历史招标信息组合成基础数据集。具体的,将历史招标信息与产品信息组合成完整的句子并且将所有句子放在一起构成符合自然语言习惯的文本。通过实验表明,符合自然语言习惯的基础数据集通过数据预处理和分词后训练得到的词向量模型质量更好。如果机械地将历史招标信息与产品信息拼接成文本,训练得到的词向量模型有较高的概率产生怪异词,例如从“变电站监控系统后台/变电站一键顺控系统/智能变电站保护设备在线监视诊断系统/变电站主设备全面监视系统”的关键词“变电站”会获得“控系统”相似词且居于最高相似位。将不当的相似词作为产品标签会增加招投标信息匹配失败的可能性。

(2)通过机器学习算法对基础数据集进行数据清洗、数据分割(分词),得到基础关键词。在数据清洗和数据分割过程中,需要去除停用词,包括标点符号、语气词和连词等,提高可匹配性。

在本发明实施例中,选择HanLP对基础数据集进行分词,对命名实体识别要求较高的场景HanLP是合适的选择,因其模型训练的语料多,载入了很多实体库,在实体边界的识别上优势。HanLP算法模型不仅考虑词语出现的频率,还考虑上下文,对歧义词和未登录词的识别具有较好的效果,且易与Elasticsearch集成。

(3)从基础关键词中选择85%作为训练集,剩下15%作为测试集,根据训练集中的基础关键词利用Word2vec训练词向量模型,然后根据测试集对训练后的词向量模型进行验证,判断模型是否达标,如果模型达标则完成训练并部署模型,如果模型不达标,则核验原因、优化基础关键词、调整模型参数,重复训练模型。

利用训练好的词向量模型计算产品信息的相似词、近义词与关系密切词,在本发明实施例中,程序设定通过词向量模型最多可获取10个产品信息的相似词、近义词与关系密切词。根据相似词、近义词与关系密切词为产品打标签,得到产品标签库。

利用智能招投标信息契合模型将招标信息与预先构建的数据库匹配包括:精准匹配和宽松匹配。招标信息可以通过任意一种模式或同时进行两种模式完成招投标信息契合匹配,一般情况下,同时采用两种匹配模式,避免出现漏配的情况。

精准匹配的具体操作如下:

步骤B01、通过分词器对招标信息进行分词。分词器使用的基准词典和停用词典直接影响分词效果。将电力行业尤其是招标物资名称、企业产品名称补充进入词典,与这些术语和物资、产品名称相似的词要从词典中删除,并且停用词典中不可包含电力行业对物资的诸多专业术语。精心调校的词典可以让训练出来的模型能够更准确地识别专业名词术语,为产品打上合理的标签,也便于更好地解析招标文本中包含的专业名词术语。

步骤B02、将分词结果与产品信息库中的产品信息进行全词匹配检索,当任一产品信息与分词结果相同时,匹配成功,输出匹配成功的产品信息,否则,匹配失败。

在步骤B01中分词之后,可以获得多个招标关键词,针对不同的招标信息,招标关键词的权重不一样,招标关键词的权重一般是根据经验给定的,比如物资类招标信息,其物资名称和物资描述权重最高,而物资名称和物资权重具有一定的相似度,物资描述比物资名称更具体,包含与参数相关的名词,通常将物资名称作为权重最高的招标关键词。

在精准匹配中,可以根据招标关键词的权重顺序进行匹配,一般情况下利用权重最高的招标关键词就能明确该条招标信息需要的产品,当权重最高的招标关键词匹配不到产品信息时,依次选择权重低一点的招标关键词进行匹配。

步骤B03、当一个招标信息与多个产品信息匹配成功时,按照匹配度对多个产品信息进行排序和展示。如果匹配失败,则需要人工核验失败原因,如果存在契合的产品但未实现匹配,则需优化产品信息和分词词典以提高精准匹配效果。

宽松匹配是为了解决精准匹配中必须通过相同词匹配的不足,宽松匹配的具体操作如下:

步骤B04、通过TextRank计算出招标信息的招标关键词。

TextRank算法是一种用于文本的基于图的排序算法,通过把文本分割成若干单元,构建节点连接图,用句子之间的相似度作为边的权重,通过迭代计算句子的TextRank值。TextRank只依赖文本本身,其用到了词之间的关联性,同时倾向于将频繁词作为关键词,由于目前尚不存在完善的针对业务相关专业术语的语料库且计算关键词时更多依赖于词之间的关联性,通过观察历史招标信息和产品信息的特点以及大量的实验表明,本实施例中使用TextRank计算关键词是最优的做法。

在本发明实施例中,使用TextRank获取招标关键词,默认输出最多10个招标关键词,可获取的招标关键词数量则取决于招标信息文本自身的长度,并根据权重降序排列,后续可以根据这些招标关键词自动得到一组按照优先度排序的产品标签(相似词),并通过反复测试来优化产品标签。

步骤B05、将招标关键词与产品标签库中的产品标签进行全词匹配检索,当任一产品标签与招标关键词相同时,匹配成功,输出匹配成功的产品标签对应的产品信息,否则,匹配失败。

步骤B06、当一个招标信息与多个产品信息匹配成功时,按照匹配度对多个产品信息进行排序和展示。匹配失败则人工核验失败原因,是否确实不存在契合的产品,如果存在,则说明产品标签本身不够完善,没有准确的词汇能够表达该产品的功能,需要优化产品标签,并在必要时进行模型迭代训练,提高宽松匹配效果。

宽松匹配总体上遵从“宁误不漏”的匹配准则,漏配是指该招标信息需要的产品存在,但没有匹配到对应的产品信息,误配是指匹配到与招标信息需要的产品完全无关的产品信息。在宽松匹配中,使用招标关键词与产品标签库进行全词匹配,产品的标签越多被匹配到的可能性就越大,同理,输入的招标信息的关键词越多,该招标信息能匹配到的产品数量也就越多,图3展示了某产品在进行模型迭代训练和验证的过程中,招标关键词和相似词的个数对匹配度的影响(总匹配次数为100次)。因此宽松匹配漏配的概率大大降低,但误配的概率有所增加,需要不断优化宽松匹配的模型。

在步骤B中,以招标关键词作为检索单位进行全词匹配检索,理论上招标关键词的数量记为总匹配次数,当一个招标关键词能够匹配到相同的产品信息或产品标签时,表示该次匹配成功。完成所有招标关键词的匹配后,得到所有匹配成功的产品信息或产品标签,如果匹配成功的产品信息或产品标签属于同一个产品,则统计该产品的匹配成功次数,并计算该产品与招标信息的匹配度。匹配度=匹配成功次数/总匹配次数*100%,比如,招标信息A经过TextRank计算后得到10个招标关键词,通过宽松匹配,共有8个招标关键词匹配到了对应的产品标签,其中5个产品标签属于产品B,3个产品标签属于产品C,则产品B与招标信息A 的匹配度为5/10*100%=50%,产品C与招标信息A的匹配度为3/10*100%=30%。匹配度可以体现招标公告的信息描述与产品之间的相似程度。

步骤C、将匹配成功的招标信息和产品信息按照预设文本格式以短信、邮件的方式推送给投标负责人,当存在多个匹配成功的产品信息时,对多个产品信息进行排序,然后将排序结果也发送给投标负责人,以便投标负责人根据匹配度做出投标选择,提高投标的准确性。

在本发明实施例中,智能招投标信息契合模型配置有Rest API,通过Rest API与第三方系统集成调用,便于共享、应用招标信息和产品信息。

实施例2:

基于实施例1中的智能招投标信息契合方法,本发明还提出了一种智能招投标信息契合装置,包括如下步骤:

招标信息采集模块,用于通过爬虫程序从相关招标网站上获取招标信息,招标网站主要包括企业级电子商务平台、企业级供应链统一服务平台以及其他相关行业招投标网站。

招投标信息契合模块,用于利用智能招投标信息契合模型将招标信息与预先构建的数据库匹配,得到与招标信息相匹配的产品信息,其中,预先构建的数据库包括产品信息库和产品标签库。

信息推送模块,用于将匹配成功的招标信息和产品信息推送给投标负责人。

第三方集成模块,用于提供Rest API供第三方系统集成调用。

Web应用模块,后端采用Spring Boot开发,前端采用React开发,用于展示招标信息和产品信息。

与现有技术相比,本发明方法能够对采集到的招标公告数据进行深层次的解析,可以有效提高招投标信息的匹配准确度,进而提高推送精准度,实现自动化、智能化的招投标信息契合。本发明方法强化了客户招标信息(需求)与企业产品功能及服务能力的智能化衔接管理,使用智能数据分析技术提高客户服务契合水平,为客户提供精准靶向服务,为企业与客户创造价值。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号