首页> 中文期刊> 《信息技术》 >Nutch中文分词插件的编写与实现

Nutch中文分词插件的编写与实现

         

摘要

开源搜索引擎Nutch是针对英文环境开发的,针对Nutch对中文进行单字切分的不足,在剖析Nutch分词器的基础上,基于Nutch的插件机制,结合中科院的中文分词系统ICTCLAS,成功地实现了Nutch对中文的词语切分,完善了基于Nutch的中文搜索引擎的开发.

著录项

  • 来源
    《信息技术》 |2010年第2期|97-100,103|共5页
  • 作者单位

    武汉军械士官学校光电仪器与指挥控制系,武汉,430075;

    江苏省邮电规划设计院有限责任公司,南京,210006;

    武汉军械士官学校光电仪器与指挥控制系,武汉,430075;

    武汉军械士官学校光电仪器与指挥控制系,武汉,430075;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 检索机;
  • 关键词

    Nutch; ICLCLAS; 插件机制; 中文分词;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号