首页> 中文学位 >融合多策略的维吾尔语词干提取方法
【6h】

融合多策略的维吾尔语词干提取方法

代理获取

摘要

维吾尔语是形态变化复杂的黏着性语言之一,词的构成和其词义都是依赖于形式复杂的词缀连接来表示的。词缀不仅改变词根的词义,也会决定一个词在句子中的作用。因此只要正确的把词干和词缀分开才能正确的表示整体单词所表达的真正意义。到目前为止,维吾尔语词干提取的性能仍存在较大的改进空间。因此我们从维吾尔语构词特点出发,对维吾尔语词干进行了研究。
  本文针对维吾尔语词的形态结构特点出发,提出了两种维吾尔语词干提取模型,一个是融合多策略的维吾尔语词干提取模型。前辈的基于规则和统计相结合的维吾尔语词干提取方法的准确率达到了95%,为了解决前辈的系统切分当中存在的歧义现象和过度切分问题提出了融合词性特征和上下文词干信息。实验结果表明,与基准系统比较,融入的词性特征和上下文词干信息的词级实验准确率分别达到了95.19%和96.60%。
  另一个维吾尔语词干提取模型是基于词干-词缀统计量的维吾尔语词干提取模型,此方法的词干提取准确率达到了94%,为了进一步提高系统的性能,我们引入词干-词缀权重比例后准确率达到了95.69%。虽然这个方法对维吾尔语词干提取系统性能有所贡献,但后续还要进一步分析研究维吾尔语的词干-词缀,词干-复合词缀之间的语法规则来进一步提高词干提取系统的准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号