首页> 中国专利> 基于政策文本分类和关键信息识别的政策文本分析方法

基于政策文本分类和关键信息识别的政策文本分析方法

摘要

本发明公开了一种基于政策文本分类和关键信息识别的政策文本分析方法,属于自然语言处理技术领域。本发明提供的政策文本分类器通过在原始段落中增加分类任务的提示语言,该提示语言中包含需要预测并填写标签的掩码位置,将段落分类问题转换为类型完形填空的分类预测问题,简化了段落分类预测的过程,能够基于所构建的完整的政策文件要素体系,更精准地从内容构成和文件结构的角度解析政策文件文本,并挖掘出更深层的信息。提供的政策信息识别器通过在所构建的政策文本要素体系下预测空缺内容标签的方式同样简化了文本实体的识别难度,并且在训练数据规模较小时有较好的表现。

著录项

  • 公开/公告号CN115310425A

    专利类型发明专利

  • 公开/公告日2022-11-08

    原文格式PDF

  • 申请/专利号CN202211229194.3

  • 发明设计人 杨象笋;李响;胡奇韬;王江华;

    申请日2022-10-08

  • 分类号G06F40/205;G06F40/211;G06F40/279;G06K9/62;

  • 代理机构杭州信义达专利代理事务所(普通合伙);

  • 代理人陈继算

  • 地址 310000 浙江省杭州市西湖区文一西路83号浙江财经大学文华校区综合楼201室

  • 入库时间 2023-06-19 17:32:10

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-08

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号