中文词聚类研究

胡和平; 曾庆锐; 路松峰

首页> 中文期刊> 《计算机工程与科学》 >中文词聚类研究

中文词聚类研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

词聚类是语言自动处理中一个重要的基础环节.针对中文词聚类研究中训练数据缺乏、质量不高而影响聚类效果这一主要障碍,本文提出一种面向中文的词聚类算法,算法以词的上下文分布相似度作距离量度;然后分析了仅依据距离量度进行中文词聚类的缺陷,提出词的临近空间概念,并根据词的临近空间概念进行聚类,使得在不用指定类的数目与大小的情况下,依靠词的内在语义进行聚类;最后,算法再将聚类结果作为计算相似度的依据,进行EM迭代聚类,使聚类结果得到明显优化.实验证明,算法有效地克服了中文训练数据的数量和质量问题,聚类结果好.

著录项

来源
《计算机工程与科学》 |2006年第1期|122-124142|共4页
作者
胡和平; 曾庆锐; 路松峰;
展开▼
作者单位

华中科技大学计算机科学与技术学院;

湖北;

武汉;

430074;

华中科技大学计算机科学与技术学院;

湖北;

武汉;

430074;

华中科技大学计算机科学与技术学院;

湖北;

武汉;

430074;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
中文词; 词; 聚类; 词的临近空间; EM算法;

相似文献

中文文献
外文文献
专利

1. 利用word2vec对中文词进行聚类的研究 [J] . 郑文超 ,徐鹏 . 软件 . 2013,第012期
2. 词义在汉英中型语文词典中的表现形式研究 [J] . 焦子桓 ,艾红娟 . 榆林学院学报 . 2021,第001期
3. 大型语文词典修订中的照应问题研究 [J] . 赵红梅 ,程志兵 . 伊犁师范学院学报（社科版） . 2020,第004期
4. 旧约中“世界”原文词义研究 [J] . 弘道 . 天风 . 2020,第009期
5. 语文词典中同实异名外来词的收录、立目研究——基于《现代汉语词典》第7版与《现代汉语规范词典》第3版对比分析 [J] . 李俊杰 ,冯海霞 . 辞书研究 . 2019,第002期
6. 基于聚类的中文词汇链构建算法的研究 [C] . 练睿婷 ,史晓东 . 第十二届全国少数民族语言文字信息处理学术研讨会 . 2009
7. 大学生英语作文词汇错误分析——东软信息学院学生作文词汇错误案例分析 [A] . 王璐 . 2010

中文词聚类研究

摘要

著录项

相似文献

相关主题

期刊订阅