首页> 中国专利> 多语言新闻文本聚类方法、存储介质及终端设备

多语言新闻文本聚类方法、存储介质及终端设备

摘要

本发明公开了一种多语言新闻文本聚类方法,包括:预先获取多语言新闻文本中的每一篇单语言新闻文本的文本特征;基于关键词重合度根据每一篇所述单语言新闻文本的文本特征对所述单语言新闻文本进行聚类,对应获得每一种所述单语言新闻文本的单语言聚类簇集合;根据每一种所述单语言新闻文本的单语言聚类簇集合获得所述多语言新闻文本的跨语言聚类簇集合。相应的,本发明还公开了一种计算机可读存储介质及终端设备。采用本发明的技术方案能够不依赖于多语言资源实现大规模的多语言新闻文本聚类,满足对中文、英语、印尼语和马来语的多语言网络舆情分析的需求,并提高聚类速度和效率。

著录项

  • 公开/公告号CN109063184B

    专利类型发明专利

  • 公开/公告日2020-09-01

    原文格式PDF

  • 申请/专利权人 广东外语外贸大学;

    申请/专利号CN201810979185.3

  • 发明设计人 蒋盛益;李锦贤;林楠铠;

    申请日2018-08-24

  • 分类号G06F16/35(20190101);

  • 代理机构44202 广州三环专利商标代理有限公司;

  • 代理人麦小婵;郝传鑫

  • 地址 510420 广东省广州市白云大道北2号

  • 入库时间 2022-08-23 11:12:17

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号