基于改进的潜在语义分析的文本聚类

宋涛; 施水才; 房祥; 吕学强

首页> 中文期刊> 《北京信息科技大学学报（自然科学版）》 >基于改进的潜在语义分析的文本聚类

基于改进的潜在语义分析的文本聚类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本聚类中不同文本表示方法获得的聚类效果不尽相同.引入潜在语义分析模型对文本进行表示,重新给出了针对潜在语义分析的特征权重计算方法,并提出了截断奇异值分解中K值的选取方法,达到了“词-文本”空间的降维去噪目的.鉴于K-means算法中初始聚类中心选取具有一定的随机性,应用相似性初始聚类中心选取方法确定了K-means的初始聚类中心,避免了随机选取聚类中心对聚类效果的影响.基于改进的潜在语义分析方法极大的降低了文本空间的维度,经实验证明改进后的方法在聚类问题中聚类效果显著.

著录项

来源
《北京信息科技大学学报（自然科学版）》 |2012年第3期|21-25|共5页
作者
宋涛; 施水才; 房祥; 吕学强;
展开▼
作者单位

北京信息科技大学计算机学院,北京 100192;

北京信息科技大学计算机学院,北京 100192;

北京信息科技大学计算机学院,北京 100192;

北京信息科技大学计算机学院,北京 100192;

展开▼
原文格式 PDF
正文语种 chi
中图分类专用应用软件;
关键词
潜在语义分析; 权重计算; 奇异值分解; K-means; 文本聚类;

相似文献

中文文献
外文文献
专利

1. 改进的概率潜在语义分析下的文本聚类算法 [J] . 张玉芳 ,朱俊 ,熊忠阳 . 计算机应用 . 2011,第003期
2. 基于潜在语义分析和自组织特征映射神经网络的文本聚类研究 [J] . 王剑锋 ,麻丽娜 ,李新叶 . 计算机与现代化 . 2010,第2期
3. 基于潜在语义分析的中文文本聚类方法研究 [J] . 李华云 . 科技情报开发与经济 . 2008,第027期
4. 基于概率潜在语义分析的文本聚类研究 [J] . 吴金学 . 青岛理工大学学报 . 2008,第002期
5. 基于改进潜在语义分析算法的文本情感分类研究 [J] . 王旭仁 ,郑秋辉 ,刘丽珍 . 计算机教育 . 2014,第019期
6. 基于改进潜在语义分析的交叉语言检索 [C] . 宁健 ,林鸿飞 . 第五届全国信息检索学术会议CCIR2009 . 2009
7. 一种改进的概率潜在语义分析下的文本聚类算法研究 [A] . 朱俊 . 2011

基于改进的潜在语义分析的文本聚类

摘要

著录项

相似文献

相关主题

期刊订阅