...
首页> 外文期刊>Pomiary Automatyka Kontrola >Wyznaczanie równoległości pętli programowych w aplikacjach dedykowanych dla procesorów graficznych
【24h】

Wyznaczanie równoległości pętli programowych w aplikacjach dedykowanych dla procesorów graficznych

机译:确定图形处理器专用应用程序中软件循环的并行性

获取原文
获取原文并翻译 | 示例
           

摘要

Extracting synchronization-free slices allows automatically generating parallel loops. The code can be executed on multi-processors machines in a reduced period of time. Slicing techniques enable also generating parallel code for graphics processing in general purpose computing. Nowadays, graphic cards support executing multi-threaded applications. GPU systems consist of tens or hundreds of processors. CUDA (an acronym for Compute Unified Device Architecture) is a parallel computing architecture developed by NVIDIA. Graphics processing units (GPUs) are accessible to software developers through variants of industry standard programming languages. Using CUDA, the latest NVIDIA GPUs become accessible for computation like CPUs. The model for GPU computing is to use a CPU and GPU together in a heterogeneous co-processing computing model. The sequential part of the application runs on the CPU and the computationally-intensive part is accelerated by the GPU. From the user's perspective, the application just runs faster because it uses the high-performance of the GPU to boost performance. In this paper slicing algorithms are examined for generating a parallel code for graphic cards are examined. A short example of the code is presented. CUDA statements and technique are explained. Memory cost and transfer data is considered. Speed-up, efficiency and scalability of the code are analyzed.%Ekstrakcja równoległości w postaci niezależnych fragmentów kodu pozwala wygenerować równoległe pętle programowe w sposób automatyczny. Kod taki umożliwia wykorzystanie mocy obliczeniowej maszyn równoległych, w tym wieloprocesorowych kart graficznych. W niniejszym artykule poddano analizie zastosowanie algorytmów wyznaczania fragmentów kodu dla aplikacji dedykowanych dla procesorów graficznych. Zbadano przyspieszenie i efektywność obliczeń oraz skalowalność wygenerowanego kodu równoległego.
机译:提取免同步切片可自动生成并行循环。该代码可以在较短的时间内在多处理器计算机上执行。切片技术还可以生成并行代码,以用于通用计算中的图形处理。如今,图形卡支持执行多线程应用程序。 GPU系统由数十或数百个处理器组成。 CUDA(计算统一设备架构的缩写)是NVIDIA开发的并行计算架构。软件开发人员可以通过各种行业标准编程语言来访问图形处理单元(GPU)。使用CUDA,可访问最新的NVIDIA GPU,以进行CPU等计算。用于GPU计算的模型是在异构协同处理计算模型中一起使用CPU和GPU。应用程序的顺序部分在CPU上运行,而计算密集型部分则由GPU加速。从用户的角度来看,该应用程序运行得更快,因为它利用GPU的高性能来提高性能。在本文中,检查了用于生成图形卡并行代码的切片算法。给出了代码的简短示例。解释了CUDA语句和技术。考虑内存成本和传输数据。分析了代码的提速,效率和可扩展性。 Kod takiumożliwiawykorzystanie mocy obliczeniowej maszynrównoległych,w tym wieloprocesorowyy kart graficznych。 W niniejszym artykule poddano analizie zastosowaniealgorytmówwyznaczania片段– kodu dla aplikacji dedykowanych dlaprocesorówgraficznych。 Zbadano przyspieszenie iefektywnośćobliczeńorazskalowalnośćwygenerowanego kodurównoległego。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号