基于神经网络的复杂垃圾信息过滤算法分析

张建; 严珂; 马祥

首页> 中文期刊> 《计算机应用》 >基于神经网络的复杂垃圾信息过滤算法分析

基于神经网络的复杂垃圾信息过滤算法分析

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

垃圾信息的识别是自然语言处理方面主要的任务之一。传统方法是基于文本特征或词频的方法,其识别准确率主要依赖于特定关键词的出现与否,存在对关键词识别错误或对未出现关键词的垃圾信息文本识别能力较差的问题,提出基于神经网络的方法。首先,利用传统方法针对这一类垃圾信息文本进行识别训练和测试;然后,利用从垃圾短信、广告和垃圾邮件数据集中挑选出传统方法识别困难的垃圾信息,再从原数据集中随机挑选出同样数量的正常信息,将其组成三个无重复数据的新数据集;最后,以卷积神经网络和循环神经网络为基础,建立了三个模型,并在新数据集上进行识别训练。实验结果表明,基于神经网络的方法可以从文本中学习到更好的语义特征,在三个数据集上均能达到98%以上的准确率,高于朴素贝叶斯(NB)、随机森林(RF)、支持向量机(SVM)等传统方法。实验结果还显示,不同的神经网络适用于不同长度的文本分类,由循环神经网络组成的模型擅长识别句子长度的文本,由卷积神经网络组成的模型擅长识别段落长度的文本,由两者共同组成的模型擅长识别篇章长度的文本。

著录项

来源
《计算机应用》 |2022年第3期|770-777|共8页
作者
张建; 严珂; 马祥;
展开▼
作者单位

中国计量大学信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工神经网络与计算;
关键词
垃圾信息; 识别与过滤; 文本特征; 词频; 神经网络;

相似文献

中文文献
外文文献
专利

1. 基于微博客系统中的文本信息过滤算法分析与探讨 [J] . 张瑞娟 . 科技广场 . 2012,第009期
2. 基于特征矩阵构造与BP神经网络的垃圾文本过滤模型 [J] . 方瑞 ,于俊洋 ,董李锋 . 计算机工程 . 2020,第008期
3. 基于TF-IDF和改进BP神经网络的社交平台垃圾文本过滤 [J] . 王杨 ,王非凡 ,张舒宜 . 计算机系统应用 . 2019,第003期
4. 基于改进的Na(l)ve Bayes和BP神经网络的垃圾邮件过滤 [J] . 方莹 . 兰州理工大学学报 . 2011,第002期
5. 基于神经网络的中文垃圾邮件过滤系统研究 [J] . 叶嫣 ,李培国 . 电脑知识与技术 . 2011,第008期
6. 一种基于地址与内容过滤的垃圾电子邮件过滤器模型 [C] . 王振旗 ,刘静 . 2005中国控制与决策学术年会 . 2005
7. 基于神经网络集成的垃圾邮件过滤系统设计 [A] . 刘宝萍 . 2010

基于神经网络的复杂垃圾信息过滤算法分析

摘要

著录项

相似文献

相关主题

期刊订阅