首页> 中文会议>中国中文信息学会二十五周年学术会议 >基于最大熵模型的汉语动词与动词搭配识别

基于最大熵模型的汉语动词与动词搭配识别

摘要

句法分析一直是自然语言处理领域的一个重点和难点问题,准确的动词与动词搭配关系识别可为建立完全的句法分析奠定一定的基础.本文提出了一种基于最大熵模型的汉语动词与动词搭配识别方法,选取目标动词与搭配词的上下文词性信息及其关联程度的统计信息构造候选复合特征模板以及类别信息,利用粗糙集理论中的约简技术,删除复合特征模板中冗余的原子模板,从而获得训练最大熵模型所需的极小模板.四组实验结果表明(1)以同时包含上下文词性信息和统计信息的模板与类别信息模板结合构造的识别模型优于仅含上下文词性信息或统计信息的模板与类别信息模板结合所构造的识别模型;(2)较之搭配定量体系方法,最大熵模型的搭配识别效果较好;(3)结合了粗糙集理论的最大熵方法保证了所构造的模型的简洁性,提高了模型的泛化能力.总之,最大熵模型用于动词与动词搭配识别是可行的.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号