首页> 中文期刊> 《上海电力学院学报》 >基于LSTM的中文文本多分类应用研究

基于LSTM的中文文本多分类应用研究

         

摘要

随着互联网的发展,网上购物成为主流消费方式,随之产生了大量的商品文本数据,需要对商品进行准确而高效的分类.利用机器学习进行文本分类需要进行复杂的人工设计特征和提取特征过程.随着深度学习领域的发展,基于深度学习的文本分类技术效果显著.设计了一个基于长短期记忆网络(LSTM)的中文文本多分类器.首先对数据进行预处理,利用Tokenizer分词技术将文本处理为计算机可理解的词向量传入LSTM网络,并加入Dropout算法以防止过拟合得出最终的分类模型.将该模型与逻辑回归、多项式朴素贝叶斯、线性支持向量机、随机森林模型进行对比发现,基于LSTM的中文文本多分类方法具有较好的效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号