首页> 中文期刊> 《浙江外国语学院学报》 >基于词库与词法的分词不一致研究

基于词库与词法的分词不一致研究

         

摘要

分词不一致问题一直严重影响带标注语料库的标注质量,利用词库与词法知识,可以合理地阐释分词不一致产生的根源,并结合建立的规则库、组合型歧义库、固定词表和特殊单字词表,可以解决汉语分词语料库中相同结构类型的分词不一致问题。计算机利用这些知识较好地识别出了"大+动词(单字)""动补结构"和"颜色词+物体名",召回率在96%以上,精确率在95%以上,并能根据用户的要求统一处理成"分"或"合"的形式。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号