首页> 中文会议>第六届全国信息检索学术会议 >基于模板转换的平行语料自动获取

基于模板转换的平行语料自动获取

摘要

双语平行语料库是自然语言处理领域的重要资源。针对当前双语语料获取困难的现状,本文提出基于模板转换的方法对互联网上平行语料进行自动获取,采用基于转换模式数量和转换模式检索排序的方法进行双语平行文本验证。本系统可通过对互联网中的大量平行文本的自动获取来构建大规模的汉英平行语料库。该方法的性能在ClueWeb09数据集上得到了实验验证。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号