首页> 中国专利> 用于处理分布式集群中的深度学习作业的方法和装置

用于处理分布式集群中的深度学习作业的方法和装置

摘要

本申请实施例公开了用于处理分布式集群中的深度学习作业的方法和装置。该方法的一具体实施方式包括:基于租户提交的深度学习任务创建深度学习训练作业,深度学习训练作业包括深度学习运算进程的分布式训练作业以及参数服务器的分布式训练作业;判断为租户所在租户组分配的资源中的当前资源余量是否满足深度学习训练作业的资源需求;若满足,将深度学习训练作业添加至租户所在租户组对应的作业队列中;按照作业队列中的作业的优先级将深度学习训练作业通过集群管理器适配器提交至对应的集群管理器,以供集群管理器基于所管理的分布式计算节点执行深度学习训练作业,并存储运行结果。该实施方式提升了作业处理效率。

著录项

  • 公开/公告号CN109034396B

    专利类型发明专利

  • 公开/公告日2022.12.23

    原文格式PDF

  • 申请/专利权人 北京百度网讯科技有限公司;

    申请/专利号CN201810759278.5

  • 发明设计人 杨金锋;

    申请日2018.07.11

  • 分类号G06N3/08;G06F9/50;

  • 代理机构北京英赛嘉华知识产权代理有限责任公司;

  • 代理人王达佐;马晓亚

  • 地址 100085 北京市海淀区上地十街10号百度大厦2层

  • 入库时间 2023-01-09 21:32:12

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号