首页> 中国专利> 一种通用的基于关联的词性标注方法

一种通用的基于关联的词性标注方法

摘要

本发明涉及一种通用的基于关联的词性标注方法,属于自然语言处理技术领域。本发明首先选择合适的文档作为语料库,并把语料库按句分行处理;然后对语料库进行标注,即为每个单词标注出词性;接着统计标注好的语料库,得到一个状态转移矩阵,为以后的预测阶段提供依据;然后对标注好的语料库提取每个字的特征,为了提高准确性,每个字的特征都包括其上下相邻两个字的属性;然后使用每个单词的特征文件训练一个模型;最后,通过状态转移矩阵和概率模型预测待标注词性的句子中的每个单词的词性。

著录项

  • 公开/公告号CN109325225B

    专利类型发明专利

  • 公开/公告日2022-04-12

    原文格式PDF

  • 申请/专利权人 昆明理工大学;

    申请/专利号CN201810985852.9

  • 发明设计人 邵玉斌;郭海震;龙华;杜庆治;

    申请日2018-08-28

  • 分类号G06F40/253(20200101);

  • 代理机构

  • 代理人

  • 地址 650093 云南省昆明市五华区学府路253号

  • 入库时间 2022-08-23 13:27:28

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号