首页> 中文期刊> 《中文信息学报》 >央金藏文分词系统

央金藏文分词系统

         

摘要

藏文分词是藏文信息处理的一个基本步骤,该文描述了我们将一个基于HMM的汉语分词系统Segtag移植到藏文的过程,取得了91%的准确率.又在错误分析的基础上,进行了训练词性的取舍、人名识别等处理,进一步提高了准确率.%This paper describes the porting of a Chinese segmentation system to handle Tibetan. The F-measure of the new Yangjin system is above 91% over a test corpus although the training corpus is relatively small . It also describes more processing upon error analysis which led to further improvement.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号