首页> 中国专利> 行业资讯正负面模型构建方法和系统、识别方法和系统

行业资讯正负面模型构建方法和系统、识别方法和系统

摘要

本发明公开了一种行业资讯正负面模型构建方法和系统、行业资讯正负面识别方法和系统,其中,行业资讯正负面模型构建方法包括:根据每一条行业资讯数据得到资讯分词数据;根据资讯分词数据得到资讯去停用词数据;根据资讯去停用词数据经过行业分类模型进行筛选得到资讯分类筛选数据;对资讯分类筛选数据进行行业知识库过滤得到资讯句式过滤数据;对资讯句式过滤数据进行模型知识蒸馏得到训练数据集和测试数据集;通过训练数据集进行bert模型训练得到正负面初始模型,通过测试数据集进行模型优化得到行业资讯正负面最终模型。该方法在资讯进入模型层前先通过行业分类模型和行业知识库过滤,保证进入模型的资讯符合行业特征,提高了模型构建的准确性。

著录项

  • 公开/公告号CN113886579A

    专利类型发明专利

  • 公开/公告日2022-01-04

    原文格式PDF

  • 申请/专利权人 北京智慧星光信息技术有限公司;

    申请/专利号CN202111120206.4

  • 发明设计人 龚浩;彭璿韬;李青龙;

    申请日2021-09-24

  • 分类号G06F16/35(20190101);G06F16/335(20190101);G06F40/284(20200101);

  • 代理机构11876 北京智宇正信知识产权代理事务所(普通合伙);

  • 代理人李明卓

  • 地址 100080 北京市海淀区海淀大街8号A座22层A区

  • 入库时间 2023-06-19 13:32:21

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号