首页> 中文学位 >基于贝叶斯算法的多语言文档分类
【6h】

基于贝叶斯算法的多语言文档分类

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 文本分类发展历程

1.2.2 多语言文本分类研究现状

1.3 机器学习相关概念

1.4 论文研究内容

1.5 论文组织结构安排

第二章 相关技术简介

2.1 模式分类相关算法概述

2.2 文本分类相关技术研究

2.2.1 文本分类定义

2.2.2 文本预处理

2.2.3 文本表示

2.2.4 特征提取和特征选择

2.3 常见的文档分类方法

2.3.1 贝叶斯理论及朴素贝叶斯算法

2.3.2 K-近邻算法

2.3.3 Rocchio分类算法

2.4 分类算法的分析与比较

2.5 本章小结

第三章 多语言文本自动分类系统设计

3.1 多语言文本分类系统需求分析

3.2 多语言文本自动分类系统设计原则

3.3 多语言文本分类系统概要设计

3.3.1 设计方法简介

3.3.2 系统模块设计

3.3.3 多语言文本分类系统综合介绍

3.4 系统模块介绍

3.4.1 可视化模块

3.4.2 训练集处理模块

3.4.3 概率计算模块

3.4.4 文本预处理模块

3.5 本章小结

第四章 多语言文本自动分类系统实现

4.1 多语言功能简介

4.2 多语言功能设计与系统实现

4.2.1 文本预处理

4.2.2 特征提取

4.2.3 分类器的选择

4.3 多语言功能的局限与扩展

4.4 本章小结

第五章 系统测试与分析

5.1 系统语料选取

5.2 系统性能分析

5.3 自我评价

5.4 系统现存缺陷与改进

5.4.1 关键词提取

5.4.2 多语言功能

5.5 本章小结

第六章 总结与展望

6.1 本文工作总结

6.2 展望

参考文献

攻读学位期间公开发表的论文

致谢

展开▼

摘要

随着时代的变迁,信息技术得到了快速的发展且趋于成熟。人们对于信息的获取途径不再是通过报纸或者口口相传的方式,而是基于各种媒体的方式,如电视、电脑、手机等途径。面对信息量爆炸式增长,人们对于快速获取有用信息的要求不断提高。如何尽可能有效地组织和管理信息变得尤为重要。传统的单一语言文本分类系统在处理这些信息分类的问题上已经远远不能达到人们的要求。因此,如何实现海量文本信息高效准确的多语言文档分类显得尤为重要。
  本文在阐述文本分类的发展历程基础上,通过比较分析贝叶斯算法、K-近邻算法和Rocchio算法,结合多语言特点,设计并实现了基于贝叶斯算法的多语言文本分类器的系统设计与实现,并对系统性能进行了简单测试,结果表明它能实现分类功能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号