基于不平衡数据集的文本分类技术

王成强

首页> 中文期刊> 《电脑知识与技术：学术交流》 >基于不平衡数据集的文本分类技术

基于不平衡数据集的文本分类技术

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本自动分类是信息检索和数据挖掘领域的研究热点和核心技术,但是在实际应用中,经常会出现文本实例中一些类中欧冠的文本很多,而另一些类中的文本较少的情况,而这些应用往往就是为了预测其中很少出现但很重要的文本,这就是所谓的文本分类不平衡问题。传统方法对少数类的识别率低,如何有效的提高少数类的分类性能成为机器学习和模式识别领域亟待解决的问题。因此,该文针对提高不平衡数据集中的少数类文本的分类性能之一问题,从数据层面处理的角度对数据进行重抽样。使用随机抽样的方法以提高分类器在非平衡数据集上的泛化性能。

著录项

来源
《电脑知识与技术：学术交流》 |2009年第12x期|10571-10572|共3页
作者
王成强;
展开▼
作者单位

贵州大学计算机科学与信息学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
不平衡数据集; 文本; 分类;

相似文献

中文文献
外文文献
专利

1. 基于不平衡数据集的文本分类技术研究 [J] . 白凤凤 . 电脑编程技巧与维护 . 2010,第006期
2. 不平衡数据集上的文本分类特征选择新方法 [J] . 张玉芳 ,王勇 ,熊忠阳 . 计算机应用研究 . 2011,第012期
3. 基于偏斜数据集的文本分类特征选择方法研究 [J] . 刘振岩 ,孟丹 ,王伟平 . 中文信息学报 . 2014,第002期
4. 基于不平衡文本分类的改进Stacking模型 [J] . 蒋瑶 ,赵礼峰 . 计算机与数字工程 . 2021,第008期
5. 基于TF-IDF特征词提取的不平衡文本分类 [J] . 陈欢 ,王忠震 . 智能计算机与应用 . 2020,第009期
6. 一种基于改进SMOTE的不平衡数据集主动学习SVM分类算法 [C] . ZHAO Xiao-qiang ,赵小强 ,LIU Meng-yi . 2016年第27届中国过程控制会议 . 2016
7. 基于不平衡数据集的文本分类技术 [A] . 于妍 . 2009

基于不平衡数据集的文本分类技术

摘要

著录项

相似文献

相关主题

期刊订阅