文本分类中基于K-means的类偏斜KNN样本剪裁

刘海峰; 姚泽清; 苏展; 张学仁

首页> 中文期刊> 《微电子学与计算机》 >文本分类中基于K-means的类偏斜KNN样本剪裁

文本分类中基于K-means的类偏斜KNN样本剪裁

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

KNN算法是经典的文本分类算法.训练样本的数量和类别密度是影响算法性能的主要瓶颈,合理的样本剪裁可以提高分类器效率.文中提出了一种基于聚类的改进KNN分类模型.首先对训练集进行聚类,基于测试样本与簇之间的相对位置对训练集进行合理裁剪以节约计算开销;然后基于簇内样本分布进行样本赋权,改善大类别样本的密度占优现象.实验结果表明,本文提出的样本剪裁方法提高了KNN算法的分类性能.

著录项

来源
《微电子学与计算机》 |2012年第5期|24-28|共5页
作者
刘海峰; 姚泽清; 苏展; 张学仁;
展开▼
作者单位

解放军理工大学理学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
K最近邻; 类偏斜; 样本剪裁; 聚类;

相似文献

中文文献
外文文献
专利

1. kNN文本分类器类偏斜问题的一种处理对策 [J] . 郝秀兰 ,陶晓鹏 ,徐和祥 . 计算机研究与发展 . 2009,第001期
2. 一种基于数据偏斜的改进KNN文本分类 [J] . 刘海峰 ,陈琦 ,刘守生 . 微电子学与计算机 . 2010,第3期
3. 基于位置的文本分类样本剪裁及加权方法 [J] . 刘海峰 ,刘守生 ,苏展 . 计算机工程与应用 . 2015,第002期
4. 基于样本重要性原理的KNN文本分类算法 [J] . 万韩永 ,左家莉 ,万剑怡 . 江西师范大学学报（自然科学版） . 2015,第003期
5. 基于密度的kNN文本分类器训练样本裁剪方法 [J] . 李荣陆 ,胡运发 . 计算机研究与发展 . 2004,第004期
6. 基于Rocchio和KNN提出的新的文本分类技术 [C] . 邱定 ,张激 ,王金华 . 2017年西南三省一市（贵州、重庆、四川、云南）自动化与仪器仪表学术年会 . 2017
7. 基于样本重要性原理的KNN文本分类算法 [A] . 万韩永 . 2015

文本分类中基于K-means的类偏斜KNN样本剪裁

摘要

著录项

相似文献

相关主题

期刊订阅