首页> 中文会议>2012全国高性能计算学术年会 >超大规模并行计算容错恢复的实现和挑战

超大规模并行计算容错恢复的实现和挑战

摘要

本文介绍和比较当前超大规模并行计算的一些容错与恢复的方法,描述IBM高性能并行计算的Checkpoint/Restart 技术架构.同时探讨了并行计算的容错和恢复在超大规模集群架构下所面临的问题和挑战,以及结合并行计算编程模型的实现,阐述其与容错/恢复机制之间的关联.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号