首页> 中国专利> 基于改进的Ring All Reduce算法的面向深度学习的GPU并行方法

基于改进的Ring All Reduce算法的面向深度学习的GPU并行方法

摘要

本发明公开了一种基于改进的RingAllReduce算法的面向深度学习的GPU并行方法,用于提升数据并行多设备间传输效率,缓解传统参数服务器并行结构带宽损耗问题;另外,利用传统深度学习主干网络包含权重参数较全连接层小,同步开销小而全连接层权重庞大梯度传输开销过高这一特点,将主干网络进行数据并行处理,全连接层采用模型并行处理,解决了数据并行模式难以支撑大规模网络参数及加速延缓的问题。相比其他方法,本方法最终测试与训练精度差异不大,但在加速效果上衰减幅度更小,效果更好,实验也发现,相比Cifar10等类别较少的数据集,该方法在miniImageNet上存在更大的加速优势,因此更适用于海量数据并行训练。

著录项

  • 公开/公告号CN113961337A

    专利类型发明专利

  • 公开/公告日2022-01-21

    原文格式PDF

  • 申请/专利权人 上海海洋大学;

    申请/专利号CN202111073054.7

  • 申请日2021-09-14

  • 分类号G06F9/50(20060101);G06K9/62(20220101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32218 南京天华专利代理有限责任公司;

  • 代理人张磊

  • 地址 200090 上海市杨浦区军工路318号

  • 入库时间 2023-06-19 13:58:51

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号