首页> 中文期刊> 《微电子学与计算机》 >具有混合奖惩信号的脉冲时间依赖可塑性算法

具有混合奖惩信号的脉冲时间依赖可塑性算法

         

摘要

近年来,具有生理学基础的脉冲时间依赖可塑性(Spiking Timing-Dependent Plasticity,STDP)规则在脉冲神经网络中得到了越来越多的应用.由STDP规则和奖惩机制相结合的R-STDP(reward-modulated STDP)学习算法在改善脉冲神经网络的性能上有良好的效果.但R-STDP算法在训练多层脉冲神经网络时,仍存在反馈信号仅作用于网络末层、中间层无法获得有用奖惩信号.为此,利用自编码器的无监督特性,提出一种具有混合奖惩信号的MR-STDP(Mix Reward-modulated STDP)算法.在中间层中增加重构层以够建基于卷积自编码器的奖惩信号因子模型,通过比较卷积层和重构层的神经元脉冲发放时间,获取中间层网络权重调整的指导因子信号.指导因子信号是对比层间自编码器的输入层与重构层的相同位置神经元所发放的脉冲序列相似性度量指标,并将其与R-STDP相结合,使得中间层能够获得权重指导信号.在MNIST和COVID-19 CT数据集上的实验结果表明,该方法取得了比R-STDP更高的精度,且中间层网络的学习效率大幅提高.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号