【24h】

The block distributed memory model

机译:块分布式内存模型

获取原文
获取原文并翻译 | 示例
           

摘要

We introduce a computation model for developing and analyzing parallel algorithms on distributed memory machines. The model allows the design of algorithms using a single address space and does not assume any particular interconnection topology. We capture performance by incorporating a cost measure for interprocessor communication induced by remote memory accesses. The cost measure includes parameters reflecting memory latency, communication bandwidth, and spatial locality. Our model allows the initial placement of the input data and pipelined prefetching. We use our model to develop parallel algorithms for various data rearrangement problems, load balancing, sorting, FFT, and matrix multiplication. We show that most of these algorithms achieve optimal or near optimal communication complexity while simultaneously guaranteeing an optimal speed-up in computational complexity. Ongoing experimental work in testing and evaluating these algorithms has thus far shown very promising results.
机译:我们介绍了一种用于在分布式存储机器上开发和分析并行算法的计算模型。该模型允许使用单个地址空间设计算法,并且不假定任何特定的互连拓扑。我们通过结合一种成本度量来捕获性能,该成本度量是由远程内存访问引起的处理器间通信的。成本度量包括反映内存等待时间,通信带宽和空间位置的参数。我们的模型允许输入数据的初始放置和流水线预取。我们使用我们的模型来开发用于各种数据重排问题,负载平衡,排序,FFT和矩阵乘法的并行算法。我们证明了这些算法中的大多数实现了最佳或接近最佳的通信复杂度,同时又保证了计算复杂度的最佳加速。迄今为止,正在进行的测试和评估这些算法的实验工作已显示出非常有希望的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号