长短期记忆网络
长短期记忆网络的相关文献在2017年到2023年内共计1088篇,主要集中在自动化技术、计算机技术、电工技术、无线电电子学、电信技术
等领域,其中期刊论文811篇、会议论文14篇、专利文献347583篇;相关期刊397种,包括电力系统自动化、电气自动化、计算机工程等;
相关会议11种,包括第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会、2017年全国高性能计算学术年会 、第六届中国计算机学会大数据学术会议等;长短期记忆网络的相关文献由3680位作者贡献,包括王刚、陈解元、孙国强等。
长短期记忆网络—发文量
专利文献>
论文:347583篇
占比:99.76%
总计:348408篇
长短期记忆网络
-研究学者
- 王刚
- 陈解元
- 孙国强
- 孙永辉
- 何伟
- 刘玮
- 卫志农
- 周衍
- 夏通
- 廖思阳
- 方志强
- 李军
- 李勇
- 李森
- 李涛
- 李静
- 王晓辉
- 赵岩
- 陈文
- 马千里
- 黄扬琪
- 候栋宸
- 刘中金
- 刘俐
- 刘勇
- 刘晓飞
- 刘泳锐
- 刘济樾
- 叶春明
- 吴晓军
- 周义
- 周家慷
- 姚良忠
- 季聪
- 宋文爱
- 尹宝才
- 尹爱军
- 张凯
- 张峰
- 张灵
- 张燕
- 张玉梅
- 张瑞
- 李一凡
- 李亚平
- 李冰
- 李华
- 李博
- 李恒
- 李晓明
-
-
李学翰;
胡四泉;
石志国;
张明
-
-
摘要:
基于面部动态表情序列,针对静态表情缺少时间信息等问题,将空间特征与时间特征融合,利用神经网络在图像分类领域良好的特征,对需要进行细节分析的表情序列进行处理,提出基于分离式长期循环卷积网络(Separate long-term recurrent convolutional networks,S-LRCN)的微表情识别方法.首先选取微表情数据集提取面部图像序列,引入迁移学习的方法,通过预训练的卷积神经网络模型提取表情帧的空间特征,降低网络训练中过拟合的危险,并将视频序列的提取特征输入长短期记忆网络(Long short-team memory,LSTM)处理时域特征.最后建立学习者表情序列小型数据库,将该方法用于辅助教学评价.
-
-
杨宏宇;
李译;
张良
-
-
摘要:
针对现有软件系统异常状态评估方法过度依赖数据标注、对时序数据的时间依赖性关注较低和系统异常状态难以量化等问题,提出一种基于混合生成网络的软件系统异常状态评估方法.首先,通过对长短期记忆网络(long short-term memory network,LSTM)与变分自动编码器(variational auto-encoder,VAE)的融合,设计一种LSTM-VAE混合生成网络,并以该网络为基础构建基于LSTM-VAE混合生成网络的系统异常状态检测模型,由LSTM对系统数据的时序特征进行提取并由VAE对系统数据的分布进行建模.然后,由LSTM-VAE异常状态检测模型处理系统关键特征参数,获取系统关键特征参数的异常度量值.最后,利用耦合度方法对传统的线性加权和方法进行优化,通过加权耦合度优化方法计算得到软件系统异常状态的量化值,从而实现对软件系统的异常状态评估.实验结果表明,本文模型对软件系统的异常时序数据具有较好的检测能力,其对系统异常状态的评估结果更为合理、有效.
-
-
李秉晨;
于惠钧;
丁华轩;
刘靖宇
-
-
摘要:
针对风速序列具有很强的随机性和波动性,提出一种基于完备总体经验模态分解(CEEMD)、长短期记忆网络(LSTM)和自回归差分移动平均(ARIMA)的组合预测模型来对短期风速进行准确预测。首先利用CEEMD算法将原始风速序列分解为多个模态分量,降低风速序列的复杂度;然后通过排列熵(PE)把风速子模态分为高频序列和低频序列,对高频序列和低频序列分别建立LSTM和ARIMA预测模型;最后把子序列预测结果叠加起来,得到最终的风速预测值。实验结果表明,该预测模型的平均绝对百分比误差(MAPE)和均方根误差(RMSE)分别为8.68%、0.389 m/s,与其他预测模型的预测结果相比,预测精度有了一定提高。
-
-
李璐;
瞿伟;
张勤;
李久元;
王宇豪;
刘祥斌
-
-
摘要:
以中国典型黄土滑坡域甘肃黑方台党川6#滑坡体为例,基于滑坡体北斗和位移计时序监测数据,首先利用深度学习框架Tensorflow分别构建3种循环神经网络滑坡位移预测模型:简单循环神经网络(simple recurrent neural network,SimpleRNN)、长短期记忆网络(long short-term memory,LSTM)和门控循环单元(gated recurrent unit,GRU),并进一步针对循环神经网络在参数设置时多采用经验手动调参或采用网格搜索法,易造成人为主观影响较大和计算效率低下的突出问题,引入遗传算法(genetic algorithm,GA)优化循环神经网络参数的自动最佳化选取,分别构建3种基于遗传算法改进的循环神经网络滑坡位移高精度预测模型:GA-SimpleRNN、GA-LSTM、GA-GRU。研究结果表明,改进参数自动寻优后的3种循环神经网络预测模型具有更优的预测性能,特别是GA-GRU模型预测精度最高,更适用于滑坡体长时序位移的高精度预测。
-
-
张睿芝;
戴凌全;
戴会超;
刘亚新;
蔡卓森;
刘芬
-
-
摘要:
针对传统的LSTM模型存在网络训练受阻、泛化能力减弱、预测精度和效率较低的问题,从模型结构和参数优选两方面进行改进。结构方面,在LSTM模型前加入具有多层结构的神经网络层;参数优选方面,采用多层网格搜索法选取模型参数。以长江中游典型通江湖泊——洞庭湖不同湖区的水位预测为例,与传统的LSTM模型、BP神经网络及水动力模型相比,改进型LSTM模型平均均方根误差分别减少58.80%、65.95%、44.14%;从预测计算时间来看,改进型LSTM模型所消耗的时间比传统的LSTM模型缩短62.12%,且明显少于水动力模型,总体来看改进型LSTM模型的整体性能优于其他三种模型。将改进型LSTM模型应用到三峡水库蓄水对洞庭湖水位的影响分析上,结果表明:三峡水库运行对洞庭湖不同湖区水位的影响具有明显的空间异质性,城陵矶站受其影响最为显著,其次为东洞庭湖鹿角站和西洞庭湖南咀站,南洞庭湖受影响最小。蓄水期间东洞庭湖城陵矶站水位平均下降0.44 m,最大降幅为1.55 m;鹿角站水位平均下降0.22 m,最大降幅为1.02 m;西洞庭湖南咀站水位平均下降0.27 m,最大降幅为1.28 m;南洞庭湖杨柳潭站水位平均下降0.15 m,最大降幅为1 m。研究成果为快速准确预测三峡水库影响下的洞庭湖水位提供了新的手段,同时也可为三峡水库的蓄水策略优化提供重要参考依据。
-
-
何津民;
张丽珍
-
-
摘要:
为提高对虾饲料的利用率,减少养殖成本,提高养殖效益,提出了一种基于自注意力机制(self-attention,ATTN)和卷积神经网络(convolutional neural network,CNN)-长短期记忆网络(long short term memory,LSTM)的对虾投饵量预测模型(CNN-LSTM-ATTN),以水温、溶解氧、对虾的数量与质量作为预测模型的输入数据,通过CNN挖掘输入数据间的内在联系,提取出数据特征信息,利用LSTM的长期记忆能力保存数据特征信息,使用ATTN突出不同时间节点数据特征的重要性,进一步提升模型的性能。结果表明,本研究中提出的CNN-LSTM-ATTN预测模型的均方根误差、平均绝对误差和平均绝对百分误差分别为0.816、0.681和0.018,均小于BP(back propagation)神经网络、LSTM和CNN-LSTM 3个基准模型,其模型预测能力和稳定性优于其他模型。研究表明,本研究中构建的模型能较好地实现对虾投饵量的准确预测,可为对虾养殖投饵量的管理调控提供参考依据。
-
-
阚高远;
杨俊
-
-
摘要:
随着生态环境意识的提高和科技的进步,气象数据的预测研究逐渐成为深度学习领域的热门话题。气象数据不仅是气象领域研究中极其重要的资料,也可应用于环境、能源等诸多领域的科学研究,对我国经济和生态环境发展起着重要作用。本文针对气象数据多波动、非线性且存在极端数据等特点,构建了经小波变换降噪处理后基于LSTM神经网络的混合预测模型。该模型首先通过小波变换将原始气象数据分解为低频和高频分量后再重新组合去噪,继而使用LSTM网络模型建模预测,并以未来时刻的气象指标作为最终预测结果。本文以平均风速、地表温度和降水为例进行实证验证。研究结果表明,与长短期记忆神经网络(Long Short-Term Memory, LSTM)等单一模型相比,本文提出的预测方法具有更高的预测精度,更小的预测误差,可为气象预警、自然灾害管控等部门提供具有参考价值的方案。
-
-
徐岩;
向益锋;
马天祥
-
-
摘要:
为了更有效地提取电力负荷数据中的潜藏特征与隐藏信息,提高电力负荷预测精度,针对负荷具有较强非线性、非平稳性和时序性特点,提出一种基于经验模态分解(empirical mode decomposition,EMD)、卷积神经网络(convolutional neural network,CNN)和长短期记忆网络(long-term and short-term memory network,LSTM)的混合模型短期电力负荷预测方法,将海量过往负荷数据、温度和历史电价信息以滑动窗口方式构造串联特征向量作为输入,先利用EMD将数据重构成多个分量,将高、中和低频分量各自叠加组合,再运用CNN提取高、中分量的潜藏特征,减少权值数量,并以特征向量的方式输入LSTM网络进行负荷预测,最后叠加各分量预测结果得到最终负荷预测值。实验结果表明,相对于BP神经网络(Back Propagation Neural Network)、支持向量机(support vector machine,SVM)、LSTM模型和EMD-LSTM模型,此模型具有更高的负荷预测精度。
-
-
吕心钰;
施佺
-
-
摘要:
城市交叉口的道路通行能力目前已成为影响居民出行效率的重要因素之一。通过正向雷达道路车辆检测器采集过车数据,利用深度学习技术Tensorflow框架构建平稳化长短期记忆网络(long short-term memory,LSTM)交通量预测模型。该模型根据预测精度自适应机制更新层数和隐藏单元数,同时为了减小交通流序列的随机性,通过季节性时间差分方法对原始交通时间序列的输出特征序列进行了平稳化处理。在使用相同数据集条件下,将所提算法的预测结果与传统算法的结果进行对比,结果表明:平稳化的LSTM网络算法能有效提高交通流量预测的准确性,实际值与预测值拟合度超过95.5%,且在均方根误差和平均百分比误差上有较大的提升,该模型可为治理交通拥堵提供依据。
-
-
胡欣;
冯杰;
徐先峰;
王世鑫
-
-
摘要:
负荷预测在保障电网安全运行和提高经济效益方面均占有举足轻重的地位。高精度的负荷预测不仅需要依靠历史负荷数据,并且气象、电价等诸多因素也会对其产生不同程度的影响。为了综合考虑诸多因素造成的影响。首先,以遴选关键因素作为切入点,利用新英格兰地区实测数据集,使用递归特征消除(RFE)有效去除冗余的影响因素,得到与真实负荷相关性高的影响因素,从而构造新的输入负荷数据。然后,利用注意力机制(Attention)动态调整各因素所占权重的特点,提出引入Attention的长短期记忆(LSTM)网络预测模型实现电力负荷预测。试验结果显示,与经典的K近邻方法(KNN)、LSTM、支持向量回归(SVR)等单一算法以及RFE-LSTM等组合算法相比,所提出的RFE-LSTM-Attention方法可以有效地提取关键负荷因素并获得良好的预测性能。
-
-
-
-
MA Jingmin;
马静旻;
FENG Jie;
冯杰;
ZHANG Jing;
张璟
- 《2020中国网络安全等级保护和关键信息基础设施保护大会》
| 2020年
-
摘要:
随着互联网的快速发展,当前的网络安全问题越来越严峻,入侵检测在其中扮演着不可替代的作用.对于入侵检测领域现有的研究常使用传统的机器学习模型对网络中的攻击事件进行分类,从而识别入侵样本,然而该方法存在检测率低且泛化性较弱的问题.为了提高入侵检测模型的准确率,设计了一种基于卷积神经网络算法的网络入侵检测模型.该模型将改进的卷积层和长短期记忆网络进行结合,并用于入侵样本空间和时间维度上的特征进行提取,在卷积层中使用深度可分离卷积层对传统的卷积层进行改进,并采用长短期记忆网络模型对网络特征中的时间序列进行学习,最终实现根据网络中的特征对入侵的攻击行为进行准确的分类.该模型针对KDD99数据集进行实验分析,在该数据集上对入侵行为进行检测,由实验结果可知该模型的准确率可到达98.7%,该模型相比其他传统机器学习模型具有更高的准确率和较高的实用性.
-
-
Fu Yujie;
符玉杰;
Li Yang;
李旸;
Wang Suge;
王素格;
Liao Jian;
廖健;
Wu Zhuojia;
吴卓嘉
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
为了挖掘用户细粒度的情感表达,方面级情感分析引起了研究者们的关注.现有的研究方法通常将方面判别任务与情感分析任务分离,且在给定方面的基础上进行情感分析.然而现实的评论数据大多没有标注方面标签,因此,对于给定的评论文本,需要同时判断方面类别及其情感极性.本文利用多个分类器同时对评论的方面及其情感进行预测,使用两层长短期记忆网络对评论的上下文信息和方面信息进行编码,并利用注意力机制对评论中相关方面的情感信息进行注意,再对多个注意力模块进行叠加增强建模得到文本的表示,在此基础上,预测句子中的方面及其对应的情感.本文在SemEval和BDCI2018汽车评论的主题及情感识别数据上分别进行了实验,结果显示本文的方法对方面级的情感分析具有较好的提升效果.
-
-
WANG Jia-cheng;
王佳铖;
BAO Jin-song;
鲍劲松;
LI Zhi-qiang;
李志强;
LU Shan-yu;
卢山雨
- 《第五届全国现代制造集成技术学术会议》
| 2018年
-
摘要:
生产车间中常因作业人员的操作失误而引发事故,为降低其中的安全隐患,需要提高作业人员的操作规范性.本文提出一种基于Openpose的车间人员作业行为识别方法:以车间人员的作业行为姿态为研究对象,采集4种典型动作的视频流作为数据集;对数据进行预处理后,使用Openpose抽取每一帧中的人体关节点信息,并以此作为输入、以行为标签作为输出,通过长短期记忆网络(LSTM)进行监督学习、训练与优化,得到行为识别的深度网络模型;最后通过改进的滑窗算法对长时间的监控视频进行行为片段的提取,并作为输入导进模型进行实时的行为检测与识别.通过实验,该方法在测试集中达到了94%的识别准确率,可用于作业人员的操作规范性监测,保障车间的安全高效运作.
-
-
柯子烜;
黄沛杰;
曾真
- 《第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会》
| 2017年
-
摘要:
“未定义”类话语在面向任务的对话语料之中广泛存在,具有成分复杂,与其余“已定义”类话语边界模糊的特点,影响着话语领域分类的总体正确率.而且,“未定义”类话语一旦错分,将使得用户对口语对话系统的功能有效性产生怀疑,大大降低用户体验.本文提出一种基于优化“未定义”类话语检测的领域分类方案,采用了两阶段法完成口语话语的领域分类任务.首先采用聚类方法,将“已定义”类话语聚为几个大类,简化众多的“已定义”类话语独立存在时和“未定义”类话语之间的边界.进而利用分类模型对聚类后的“已定义”类话语大类以及“未定义”类话语进行领域分类,优化目标是“未定义”类话语的检测效率.最后,将第一阶段分类为“已定义”类的话语,在去除了绝大部分“未定义”类话语干扰的基础上进行再次分类.本文的分类模型采用了长短期记忆网络(long short-term memory,LSTM),并利用无标签微博数据训练词向量用于话语特征表达.在SMP2017意图领域分类比赛的多任务语料上的评测结果表明,本文的方案在“未定义”类话语检测的F1值以及所有话语的领域分类总正确率上都有明显提升.
-
-
-
-