用 EDA 和禁忌搜索算法进行文本聚类

郭莉莉; 左先亮; 高尚

首页> 中文期刊> 《信息技术》 >用 EDA 和禁忌搜索算法进行文本聚类

用 EDA 和禁忌搜索算法进行文本聚类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Text clustering based on VSM ignored the acquaintance of drift problems caused by sparse text key words and semantic information between key words and the relationships between the dimensions , so text similarity computation is not accurate .In this article , TF-IDF on similarity calculation method has been improved , and it made a new clustering method .It uses distributed estimation algorithm and tabu search algorithm for clustering .Fusion has the advantages of fast convergence speed of the EDA and jump out local search of tabu search algorithms .First it preprocessed the text , and then used EDA and tabu search algorithm for clustering , in this way ,it can cluster fastly and can prevent the cluster converge to a local optimum .The test results show that this algorithm works efficiently .%基于VSM的文本聚类忽略了文本关键词稀疏带来的相似度漂移问题和关键词之间的语义信息和各维度之间的关系，致使文本的相似度计算不精确，文中对相似度计算方法TF-IDF进行了改进，并提出一种新的聚类方法，利用分布式估计算法和禁忌搜索算法进行聚类，融合分布式估计算法的收敛速度快和禁忌搜索算法能跳出局部搜索的优点，首先对文本进行预处理，然后用分布式估计算法和禁忌搜索算法聚类，既能快速聚类又能防止聚类收敛到局部最优。测试结果表明这种算法行之有效。

著录项

来源
《信息技术》 |2014年第4期|55-59|共5页
作者
郭莉莉; 左先亮; 高尚;
展开▼
作者单位

江苏科技大学计算机科学与工程学院;

江苏镇江212003;

江苏科技大学计算机科学与工程学院;

江苏镇江212003;

江苏科技大学计算机科学与工程学院;

江苏镇江212003;

展开▼
原文格式 PDF
正文语种 chi
中图分类算法理论;
关键词
文本聚类; 相似度计算; 分布式估计算法; 禁忌搜索算法;

相似文献

中文文献
外文文献
专利

1. 运用禁忌搜索算法进行高光谱影像降维的研究 [J] . 杨哲海 ,韩建峰 ,宫大鹏 . 测绘科学与工程 . 2006,第003期
2. 应用HITS算法对文本聚类结果进行类别描述的可行性分析 [J] . 赵悦阳 ,崔雷 . 医学信息学杂志 . 2012,第012期
3. 数字后端低功耗设计策略探讨——基于Synopsys EDA工具对时钟树功耗进行分析及优化 [J] . 高旭 . 中国集成电路 . 2016,第008期
4. 用EDAS-3型数据采集器对倾斜仪进行数字化改造 [J] . 盛琰 ,刘富安 ,于克滋 . 内陆地震 . 2009,第001期
5. 利用Multisim和华大九天EDA工具进行比较器设计 [J] . 王开宇 ,巢明 ,小童 . 中国集成电路 . 2008,第007期
6. 利用EDA方法进行打印机共享芯片的设计 [C] . 盛娜 ,曾繁泰 . 中国计算机学会外围设备专业委员会2003年学术研讨会 . 2003
7. 对“缓存管理”逻辑进行EDA验证 [A] . 马斌 . 2009

用 EDA 和禁忌搜索算法进行文本聚类

摘要

著录项

相似文献

相关主题

期刊订阅