首页> 中文学位 >基于改进降噪自动编码器的中文文本分类研究
【6h】

基于改进降噪自动编码器的中文文本分类研究

代理获取

目录

1 引言

1.1 研究背景与意义

1.2 国内外研究现状

1.3 论文主要研究内容

1.4 论文内容安排

2 文本分类技术

2.1 文本分类简介

2.2 文本预处理

2.3 文本表示

2.4 特征提取

2.5 文本分类的几种常见算法

2.6 本章小结

3 深度学习

3.1 深度学习理论

3.2 几种深度学习算法

3.3 本章小结

4 基于栈式降噪自动编码器的中文文本分类

4.1 降噪自动编码器

4.2 栈式降噪自动编码器

4.3 激活函数

4.4 实验

4.5 本章小结

5 基于自适应学习率和附加动量项的栈式降噪自动编码器

5.1 传统方法中的学习率

5.2 自适应学习率

5.3 附加动量项

5.4 基于自适应学习率和附加动量项的栈式降噪自动编码器算法

5.5 实验

5.6 本章小结

6 总结与展望

6.1 工作总结

6.2 展望

参考文献

致谢

作 者 简 介

声明

展开▼

摘要

随着互联网的飞速发展,人们越来越多的使用到文本分类技术.但日益增长的数据维数使得文本的处理变得非常困难.Hinton等人于2006年提了深度学习算法,对于数据量大、维度高的数据特征提取具有较好的效果. 深度学习技术已经广泛应用到大数据处理中,并在很多方面获得了可观的成绩.其中,自编码神经网络作为一种特征降维算法已被广大专家学者所应用,许多研究者纷纷将其应用在音频、图像和文本的特征降维方面.本文主要介绍了一种改进的自动编码器——栈式降噪自编码神经网络(The Stacked Denoising Auto Encoder,SDAE),该算法利用了自编码神经网络良好的特征学习能力,使学习到的特征更具鲁棒性.基于SDAE算法的文本分类模型采用了ReLU激活函数,利用该模型完成了中文新闻的文本分类工作.针对栈式降噪自编码神经网络训练时间过长的问题, 本文又提出了一种基于自适应学习率和附加动量项的降噪自编码神经网络(Adaptive learning rate and momentum terms SDAE, LMSDAE). 为了验证基于SDAE算法和LMSDAE算法的分类器的分类性能,本文采用复旦大学李荣陆提供仿真实验的新闻文本语料库和搜狗实验室提供的新闻文本语料库进行实验.通过实验可以看出,本文提出的SDAE模型的分类准确率均高于KNN算法、SVM算法、BP算法和标准自编码算法.与SDAE模型相比,LMSDAE模型不仅能够提高文本分类的准确率,也提高了模型的收敛速度.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号