首页> 中文会议>第七届中文信息处理国际会议 >一种基于规则的中文分词算法

一种基于规则的中文分词算法

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文提出了一种基于词库的结合词频、词性、中文文法规则和未登录词识别规则的分词算法,该算法首先通过采用基于词库的跨度为1的前向最大匹配分词算法获得初步的分词结果,然后依据中文文法规则和词条筛选规则对初步结果进行再次划分,得到优化的分词结果,最后通过未登录词识别规则对分词结果进行检查,将满足未登录词条件的新词加入词库.该分词算法能够在很大程度上消除歧义划分,提高未登录词的识别概率。实验结果表明,该分词算法的准确率能达到97％以上,在效率上也具有很大优势。

著录项

来源
《第七届中文信息处理国际会议》|2007年|41-45|共5页
会议地点武汉
作者
傅士光; 林友芳; 万怀宇; 徐娟娟;
展开▼
作者单位

中国中文信息学会;

武汉大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类数理语言学;文字信息处理;
关键词
分词算法; 中文文法规则; 词性标注; 未登录词识别; 词条筛选; 歧义划分;

相似文献

中文文献
外文文献
专利

1. 一种面向中文分词的搜索算法 [J] . 张天皓 . 计算机应用与软件 . 2018,第010期
2. 一种基于词典的中文分词改进算法 [J] . 郑木刚 ,刘木林 ,沈昱明 . 软件导刊 . 2016,第003期
3. 一种基于词典的中文分词改进算法 [J] . 郑木刚1 ,刘木林2 ,沈昱明1 . 软件导刊 . 2016,第003期
4. 一种适用于移动搜索的中文分词算法 [J] . 贺菲菲 ,贺炎 ,齐静娜 . 西安邮电学院学报 . 2015,第004期
5. 一种适用于移动搜索的中文分词算法 [J] . 贺菲菲1 ,贺炎2 ,齐静娜2 . 西安邮电大学学报 . 2015,第004期
6. 一种基于词典的中文分词算法 [C] . 曲宏山 ,姚青山 . 中国计算机用户协会信息系统分会2007年年会 . 2007
7. 一种基于CRFs模型的中文分词的研究与应用 [A] . 徐泽全 . 2013

一种基于规则的中文分词算法

摘要

著录项

相似文献

相关主题

期刊订阅