基于改进降噪自动编码器的中文文本分类研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的飞速发展，人们越来越多的使用到文本分类技术.但日益增长的数据维数使得文本的处理变得非常困难.Hinton等人于2006年提了深度学习算法，对于数据量大、维度高的数据特征提取具有较好的效果. 深度学习技术已经广泛应用到大数据处理中，并在很多方面获得了可观的成绩.其中,自编码神经网络作为一种特征降维算法已被广大专家学者所应用，许多研究者纷纷将其应用在音频、图像和文本的特征降维方面.本文主要介绍了一种改进的自动编码器——栈式降噪自编码神经网络(The Stacked Denoising Auto Encoder,SDAE)，该算法利用了自编码神经网络良好的特征学习能力，使学习到的特征更具鲁棒性.基于SDAE算法的文本分类模型采用了ReLU激活函数，利用该模型完成了中文新闻的文本分类工作.针对栈式降噪自编码神经网络训练时间过长的问题, 本文又提出了一种基于自适应学习率和附加动量项的降噪自编码神经网络(Adaptive learning rate and momentum terms SDAE, LMSDAE). 为了验证基于SDAE算法和LMSDAE算法的分类器的分类性能，本文采用复旦大学李荣陆提供仿真实验的新闻文本语料库和搜狗实验室提供的新闻文本语料库进行实验.通过实验可以看出，本文提出的SDAE模型的分类准确率均高于KNN算法、SVM算法、BP算法和标准自编码算法.与SDAE模型相比，LMSDAE模型不仅能够提高文本分类的准确率，也提高了模型的收敛速度.

著录项

作者
邱爽;
展开▼
作者单位

内蒙古民族大学;

展开▼
授予单位内蒙古民族大学;
学科应用数学
授予学位硕士
导师姓名裴志利;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;自动化基础理论;
关键词
改进; 降噪; 自动; 编码器; 中文文本;

相似文献

中文文献
外文文献
专利

1. 基于栈式降噪自动编码器的中文短文本分类 [J] . 邱爽 ,姜明洋 ,张智丰 . 内蒙古民族大学学报（自然科学版） . 2017,第005期
2. 基于改进的TFIDF和压缩自动编码器文本分类研究 [J] . 靖慧 ,杨振宇 ,于敏 . 山东轻工业学院学报（自然科学版） . 2017,第003期
3. 基于改进的TFIDF和压缩自动编码器文本分类研究 [J] . 靖慧 ,杨振宇 ,于敏 . 齐鲁工业大学学报：自然科学版 . 2017,第003期
4. 基于改进降噪自动编码器的点击率预测 [J] . 刘勐 ,王洪波 ,王富豪 . 计算机系统应用 . 2021,第006期
5. 基于改进的堆叠降噪自动编码器深度模型的转子-转轴系统故障诊断方法 [J] . 姜万录 ,李金虎 ,李振宝 . 机床与液压 . 2020,第021期
6. 基于降噪自动编码器的统计过程监控 [C] . GUO Peng_Ju ,郭朋举 ,YAN Wei_Wu . 2016年第27届中国过程控制会议 . 2016
7. 基于稀疏自动编码器和边缘降噪自动编码器的深度学习算法研究 [A] . 邓俊锋 . 2016

基于改进降噪自动编码器的中文文本分类研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅