首页> 中文学位 >基于多类软间隔支持向量机的文本分类问题研究
【6h】

基于多类软间隔支持向量机的文本分类问题研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1论文研究的背景及意义

1.2国内外研究现状

1.2.1文本分类的研究现状

1.2.2支持向量机的研究现状

1.3本文研究内容及论文组织结构

第2章文本分类技术

2.1文本分类的基本概念

2.2文本的预处理

2.3向量空间模型

2.4特征选取

2.5主要的分类算法

2.6分类器的性能评估

2.7本章小结

第3章统计学习理论和支持向量机

3.1统计学习理论

3.1.1学习过程的一致性

3.1.2 VC维

3.1.3推广性的界

3.1.4结构风险最小化

3.2支持向量机

3.2.1广义最优分类面

3.2.2支持向量机模型结构

3.2.3核函数

3.3本章小结

第4章一种新的软间隔支持向量机模型s-SVM

4.1软间隔支持向量机C-SVC

4.2新的软间隔支持向量机s-SVM

4.3 s-SVM的核函数和参数选择问题

4.4 s-SVM模型的多类分类算法

4.5本章小结

第5章基于s-SVM的多类分类系统的设计与实现

5.1多类分类系统设计

5.1.1语料库选择

5.1.2文本预处理

5.1.3文本向量化

5.1.4评估标准

5.1.5系统设计

5.2实验结果

5.2.1软间隔C-SVC的性能评估

5.2.2支持向量比例s-SVM的性能评估

5.3本章小节

结论

参考文献

攻读硕士学位期间发表的学术论文

致谢

展开▼

摘要

文本分类技术是对文本进行有效管理的方法之一,是一项重要的智能信息处理技术,是文本检索技术的基础。文本分类对于提高信息检索的效率和效果很有帮助,良好的分类性能是人们关注的焦点。支持向量机是一种针对分类和回归问题的新型机器学习方法,具有良好的推广性和较好的分类精确性。正在成为继模式识别和神经元网络研究之后机器学习领域新的研究热点。基于支持向量机的文本分类算法,是近年来的一个研究方向。 本文的主要研究的是把支持向量机和核函数思想应用到文本分类问题中去,论文首先探讨了文本分类的发展概况和相关技术,系统的研究了统计学习理论和支持向量机特别是核函数的相关理论,深入研究了它们在文本分类问题中的应用技术。本文所做的主要工作为:通过对支持向量机的深层分析,得出了支持向量机C-SVC的模型结构,并在此基础上定义了一个参数s,构建了一种新的软间隔支持向量机模型--s-SVM。根据核函数的理论,结合多项式核函数和径向基核函数的思想,提出了适合s-SVM模型的支持向量比例核函数及其选取策略。利用成对分类的思想解决了s-SVM的多类分类问题,给出了基于s-SVM模型的多类分类问题的详细算法。本文建立了一个文本分类系统,该系统的核心模块采用软间隔支持向量机模型C-SVC和s-SVM,使用Reuters-21578语料库对其进行测试,评价了这两种分类方法的性能,并与传统分类算法的性能进行比较,分析了其优缺点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号