声明
摘要
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 文本分类发展历程
1.2.2 多语言文本分类研究现状
1.3 机器学习相关概念
1.4 论文研究内容
1.5 论文组织结构安排
第二章 相关技术简介
2.1 模式分类相关算法概述
2.2 文本分类相关技术研究
2.2.1 文本分类定义
2.2.2 文本预处理
2.2.3 文本表示
2.2.4 特征提取和特征选择
2.3 常见的文档分类方法
2.3.1 贝叶斯理论及朴素贝叶斯算法
2.3.2 K-近邻算法
2.3.3 Rocchio分类算法
2.4 分类算法的分析与比较
2.5 本章小结
第三章 多语言文本自动分类系统设计
3.1 多语言文本分类系统需求分析
3.2 多语言文本自动分类系统设计原则
3.3 多语言文本分类系统概要设计
3.3.1 设计方法简介
3.3.2 系统模块设计
3.3.3 多语言文本分类系统综合介绍
3.4 系统模块介绍
3.4.1 可视化模块
3.4.2 训练集处理模块
3.4.3 概率计算模块
3.4.4 文本预处理模块
3.5 本章小结
第四章 多语言文本自动分类系统实现
4.1 多语言功能简介
4.2 多语言功能设计与系统实现
4.2.1 文本预处理
4.2.2 特征提取
4.2.3 分类器的选择
4.3 多语言功能的局限与扩展
4.4 本章小结
第五章 系统测试与分析
5.1 系统语料选取
5.2 系统性能分析
5.3 自我评价
5.4 系统现存缺陷与改进
5.4.1 关键词提取
5.4.2 多语言功能
5.5 本章小结
第六章 总结与展望
6.1 本文工作总结
6.2 展望
参考文献
攻读学位期间公开发表的论文
致谢