摘要
第一章 绪论
1.1 研究背景以及意义
1.2 研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 研究内容
1.4 论文的组织结构
第二章 相关理论
2.1 文本分类的过程
2.1.1 文本结构定义
2.1.2 文本分类过程
2.2 文本预处理
2.3 文本表示模型
2.3.1 向量空间模型
2.3.2 特征项权重
2.4 特征选择技术
2.4.1 文档频率
2.4.2 信息增益
2.4.3 互信息
2.4.4 x2统计量
2.5 文本分类方法
2.5.1 KNN算法
2.5.2 朴素贝叶斯算法
2.5.3 类中心向量法
2.5.4 神经网络
2.5.5 支持向量机
2.6 本章小结
第三章 总体设计
3.1 系统分析
3.2 总体架构
3.3 数据结构
3.4 系统组成
3.4.1 数据采集模块
3.4.2 数据汇聚模块
3.4.3 情报分类模块
3.5 本章小结
第四章 构建SVM-KNN文本分类模型
4.1 SVM-KNN构建流程
4.2 数据预处理
4.2.1 文本结构定义
4.2.2 分词处理及向量化
4.2.3 改进的特征向量
4.3 核函数的选取
4.4 相关参数确定
4.5 改进的SVM-KNN分类模型确定
4.6 本章小结
第五章 应用与分析
5.1 实验环境
5.2 系统应用
5.3 实验分析
5.3.1 实验数据
5.3.2 评估方法
5.3.3 测试评价
5.4 本章小结
总结与展望
参考文献
攻读硕士学位期间发表的论文
声明
致谢