分布式深度学习通信架构的性能分析

张立志; 冉浙江; 赖志权; 刘锋

首页> 中文期刊> 《计算机工程与科学》 >分布式深度学习通信架构的性能分析

分布式深度学习通信架构的性能分析

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年来,深度学习技术的进步推动人工智能进入了一个新的发展时期.但是,海量的训练数据、超大规模的模型给深度学习带来了日益严峻的挑战,分布式深度学习应运而生,逐渐成为应对这一挑战的有效手段,而高效的参数通信架构是保证分布式深度学习性能的关键.针对传统分布式深度学习模型同步架构在大规模节点上并行训练的问题,首先,分析了集中式的Parameter Server和去中心化的Ring Allreduce这2种主流的参数通信架构的原理和性能.然后,在天河高性能GPU集群上基于Ten-sorFlow构建了2种分布式训练架构的对比测试环境.最后,以Parameter Server架构为基准线,测试了Ring Allreduce架构在GPU集群环境下训练AlexNet和ResNet-50的对比性能.实验结果表明,在使用32个GPU的情况下,Ring Allreduce架构扩展效率可达97％,相比Parameter Server架构,其分布式计算性能可提升30％,验证了Ring Allreduce架构具有更好的可扩展性.

著录项

来源
《计算机工程与科学》 |2021年第3期|416-425|共10页
作者
张立志; 冉浙江; 赖志权; 刘锋;
展开▼
作者单位

国防科技大学计算机学院并行与分布处理国防科技重点实验室湖南长沙410073;

国防科技大学计算机学院并行与分布处理国防科技重点实验室湖南长沙410073;

国防科技大学计算机学院并行与分布处理国防科技重点实验室湖南长沙410073;

国防科技大学计算机学院并行与分布处理国防科技重点实验室湖南长沙410073;

展开▼
原文格式 PDF
正文语种 chi
中图分类理论、方法;
关键词
Ring Allreduce; 参数服务器; 分布式训练; 深度学习; 深度神经网络;

相似文献

中文文献
外文文献
专利

1. 基于统一通信架构的全分布式调度通信系统 [J] . 缪刚 ,戈建治 . 电声技术 . 2008,第002期
2. Hadoop分布式存储架构的性能分析 [J] . 王凌晖 ,解云月 ,周美华 . 现代电子技术 . 2018,第018期
3. 分布式文件系统KFS的架构与性能分析 [J] . 张轶彬 ,李小勇 . 微型电脑应用 . 2011,第012期
4. 分布式深度学习系统网络通信优化技术 [J] . 董德尊 ,欧阳硕 . 中兴通讯技术 . 2020,第005期
5. Platoon架构下VANETs车间通信过程及性能分析 [J] . 郭红叶 ,赵海 ,司帅宗 . 软件学报 . 2019,第004期
6. 74.基于无线网格技术的远程分布式交通信号控制系统架构 [C] . 曲大义 ,朱中 . 第三届中国智能交通年会 . 2007
7. 分布式深度学习系统中高效参数通信技术的研究与实现 [A] . 陈晓涛 . 2019

分布式深度学习通信架构的性能分析

摘要

著录项

相似文献

相关主题

期刊订阅