面向中朝跨语言文本分类的双语主题词嵌入模型的研究

王琪; 田明杰; 崔荣一; 赵亚慧

首页> 中文期刊> 《中文信息学报》 >面向中朝跨语言文本分类的双语主题词嵌入模型的研究

面向中朝跨语言文本分类的双语主题词嵌入模型的研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对日渐丰富的少数民族语言资源进行管理、研究和使用有着重要的应用价值.为了解决语言差异引起的语言鸿沟,针对中朝两种语言环境下的跨语言文本分类任务,提出了双语主题词嵌入模型.该文将词嵌入模型与主题模型扩展到双语环境,并将两种模型相结合,解决了歧义性对跨语言文本分类精度带来的影响.首先,在大规模单词级别对齐平行句对中训练中朝单词的词嵌入向量;其次,利用主题模型对中朝分类语料进行表示,并获得中朝单词的含有主题信息的词嵌入向量;最后,将中朝单词的主题词嵌入向量输入至文本分类器,进行模型的训练与分类预测.实验结果表明,中朝跨语言文本分类任务的准确率达到了91.76％,已达到实际应用的水平,同时该文提出的模型可以对一词多义单词的多个词义有很好的表示.

著录项

来源
《中文信息学报》 |2020年第12期|39-47|共9页
作者
王琪; 田明杰; 崔荣一; 赵亚慧;
展开▼
作者单位

延边大学计算机科学与技术学院智能信息处理研究室吉林延吉 133002;

延边大学计算机科学与技术学院智能信息处理研究室吉林延吉 133002;

延边大学计算机科学与技术学院智能信息处理研究室吉林延吉 133002;

延边大学计算机科学与技术学院智能信息处理研究室吉林延吉 133002;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
跨语言文本分类; 双语词嵌入模型; 主题模型; 一词多义;

相似文献

中文文献
外文文献
专利

1. 面向跨语言文本分类与标签推荐的带标签双语主题模型的研究 [J] . 田明杰 ,崔荣一 . 计算机应用研究 . 2019,第010期
2. 基于双语主题模型和双语词向量的跨语言知识链接 [J] . 余圆圆 ,巢文涵 ,何跃鹰 . 计算机科学 . 2019,第001期
3. 双语潜在语义对应分析及在跨语言文本分类中的应用研究 [J] . 罗远胜 ,王明文 ,勒中坚 . 情报学报 . 2013,第001期
4. 面向LDA主题模型的文本分类研究进展与趋势 [J] . 赵乐 ,张兴旺 . 计算机系统应用 . 2018,第8期
5. 基于主题模型和词嵌入的知识表示学习的研究 [J] . 肖宝 ,韩开旭 . 北部湾大学学报 . 2020,第004期
6. 面向中朝跨语言文本分类的双语主题词嵌入模型的研究 [C] . Wang Qi ,王琪 ,TIAN Mingjie . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018
7. 基于双语主题词嵌入模型的中朝跨语言文本分类方法的研究 [A] . 田明杰 . 2019

面向中朝跨语言文本分类的双语主题词嵌入模型的研究

摘要

著录项

相似文献

相关主题

期刊订阅