首页> 中国专利> 汉英蒙藏维多语平行语料库构建的方法

汉英蒙藏维多语平行语料库构建的方法

摘要

本分案申请公开了一种汉英蒙藏维多语平行语料库构建的方法,属于电商信息翻译领域,用于解决完成多语平行语料库的构建的问题,技术要点是通过各中文电子商务平台获取待翻译的中文商品信息,利用双语词典对部分商品信息进行翻译;且将网页标签序列的相似性以及最大匹配计算数字序列的相似性作为特征信息,利用支持向量机提取候选平行网页,再对网页进行语句切分、对齐、整理的操作,获得商品信息的汉英、汉蒙、汉藏、汉维双语平行语料,完成多语平行语料库的构建,效果是完成了多语平行语料库的构建。

著录项

  • 公开/公告号CN108763223B

    专利类型发明专利

  • 公开/公告日2022-05-13

    原文格式PDF

  • 申请/专利权人 大连民族大学;

    申请/专利号CN201810479768.X

  • 发明设计人 张俊星;贺建军;

    申请日2016-06-28

  • 分类号G06F40/58;G06F40/56;G06Q30/06;

  • 代理机构

  • 代理人

  • 地址 116600 辽宁省大连市经济技术开发区辽河西路18号

  • 入库时间 2022-08-23 13:39:06

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号