一种基于t-分布随机近邻嵌入的文本聚类方法

徐秀芳; 徐森; 花小朋; 徐静; 皋军; 安晶

首页> 中文期刊> 《南京大学学报：自然科学版》 >一种基于t-分布随机近邻嵌入的文本聚类方法

一种基于t-分布随机近邻嵌入的文本聚类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本数据具有高维、稀疏、海量的特性,给传统的聚类算法带来了极大挑战.提出一种基于t-分布随机近邻嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)的文本聚类方法.首先通过t-SNE将高维文本数据嵌入到低维空间,使得高维空间相似度较低的文本对应的映射点距离较远,而相似度较高的文本对应的映射点距离较近;然后根据低维空间映射点坐标,再采用传统的聚类分析算法进行聚类,得到最终的聚类结果.在多个基准文本数据集上进行了实验测试,验证了该方法的有效性.

著录项

来源
《南京大学学报：自然科学版》 |2019年第2期|264-271|共8页
作者
徐秀芳; 徐森; 花小朋; 徐静; 皋军; 安晶;
展开▼
作者单位

盐城工学院信息工程学院;

江苏省媒体设计与软件技术重点实验室(江南大学);

盐城工学院机械工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
聚类分析; 文本聚类; 维数约简; 随机近邻嵌入; 聚类算法;

相似文献

中文文献
外文文献
专利

1. 一种基于T-分布随机近邻嵌入的聚类集成方法 [J] . 徐森 ,花小朋 ,徐静 . 电子与信息学报 . 2018,第006期
2. 融合t-分布随机邻域嵌入与自动谱聚类的脑功能精细分区方法 [J] . 胡颖 ,王丽嘉 ,聂生东 . 波谱学杂志 . 2021,第003期
3. t分布随机近邻嵌入机械故障特征提取方法研究 [J] . 谷玉海 ,韩秋实 ,徐小力 . 机械科学与技术 . 2016,第012期
4. 核判别随机近邻嵌入分析方法 [J] . 王万良 ,邱虹 ,黄琼芳 . 计算机辅助设计与图形学学报 . 2014,第004期
5. 判别随机近邻嵌入分析方法 [J] . 郑建炜 ,邱虹 ,蒋一波 . 计算机辅助设计与图形学学报 . 2012,第011期
6. 基于局部线性嵌入和K-最近邻分类器的核动力装置故障诊断方法研究 [C] . YU Wei-feng ,于巍峰 ,LIU Yong-kuo . 中国核学会2026年学术年会 . 2017
7. 随机近邻嵌入分析方法及其在水电机组故障诊断中的应用 [A] . 邱虹 . 2014

一种基于t-分布随机近邻嵌入的文本聚类方法

摘要

著录项

相似文献

相关主题

期刊订阅