...
首页> 外文期刊>Advances in Engineering Software >Performance analysis and optimization strategies for a D3Q19 lattice Boltzmann kernel on nVIDIA GPUs using CUDA
【24h】

Performance analysis and optimization strategies for a D3Q19 lattice Boltzmann kernel on nVIDIA GPUs using CUDA

机译:使用CUDA在nVIDIA GPU上D3Q19晶格Boltzmann内核的性能分析和优化策略

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

This paper presents implementation strategies and optimization approaches for a D3Q19 lattice Boltzmann flow solver on nVIDIA graphics processing units (GPUs). Using the STREAM benchmarks we demonstrate the GPU parallelization approach and obtain an upper limit for the flow solver performance. We discuss the GPU-specific implementation of the solver with a focus on memory alignment and register shortage. The optimized code is up to an order of magnitude faster than standard two-socket x86 servers with AMD Barcelona or Intel Nehalem CPUs. We further analyze data transfer rates for the PCI-express bus to evaluate the potential benefits of multi-GPU parallelism in a cluster environment.
机译:本文介绍了在nVIDIA图形处理单元(GPU)上D3Q19格子Boltzmann流求解器的实现策略和优化方法。使用STREAM基准测试,我们演示了GPU并行化方法,并获得了流量求解器性能的上限。我们讨论了特定于GPU的求解器实现,重点是内存对齐和寄存器不足。与使用AMD Barcelona或Intel Nehalem CPU的标准两路x86服务器相比,优化后的代码的速度提高了一个数量级。我们进一步分析PCI Express总线的数据传输速率,以评估集群环境中多GPU并行性的潜在优势。

著录项

  • 来源
    《Advances in Engineering Software》 |2011年第5期|p.266-272|共7页
  • 作者单位

    Erlangen Regional Computing Center (RRZE), University of Erlangen-Nuremberg, Martensstr. I, 91058 Erlangen, Germany;

    Erlangen Regional Computing Center (RRZE), University of Erlangen-Nuremberg, Martensstr. I, 91058 Erlangen, Germany;

    Erlangen Regional Computing Center (RRZE), University of Erlangen-Nuremberg, Martensstr. I, 91058 Erlangen, Germany;

    Erlangen Regional Computing Center (RRZE), University of Erlangen-Nuremberg, Martensstr. I, 91058 Erlangen, Germany;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    cfd; gpu; lattice boltzmann; hpc; stream benchmarks; cuda;

    机译:cfd;gpu;lattice boltzmann;hpc;流基准测试;CUDA;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号