Wyznaczanie równoległości pętli programowych w aplikacjach dedykowanych dla procesorów graficznych

Włodzimierz BIELECKI; Marek PAŁKOWSKI

首页> 外文期刊>Pomiary Automatyka Kontrola >Wyznaczanie równoległości pętli programowych w aplikacjach dedykowanych dla procesorów graficznych

【24h】

Wyznaczanie równoległości pętli programowych w aplikacjach dedykowanych dla procesorów graficznych

机译：确定图形处理器专用应用程序中软件循环的并行性

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Extracting synchronization-free slices allows automatically generating parallel loops. The code can be executed on multi-processors machines in a reduced period of time. Slicing techniques enable also generating parallel code for graphics processing in general purpose computing. Nowadays, graphic cards support executing multi-threaded applications. GPU systems consist of tens or hundreds of processors. CUDA (an acronym for Compute Unified Device Architecture) is a parallel computing architecture developed by NVIDIA. Graphics processing units (GPUs) are accessible to software developers through variants of industry standard programming languages. Using CUDA, the latest NVIDIA GPUs become accessible for computation like CPUs. The model for GPU computing is to use a CPU and GPU together in a heterogeneous co-processing computing model. The sequential part of the application runs on the CPU and the computationally-intensive part is accelerated by the GPU. From the user's perspective, the application just runs faster because it uses the high-performance of the GPU to boost performance. In this paper slicing algorithms are examined for generating a parallel code for graphic cards are examined. A short example of the code is presented. CUDA statements and technique are explained. Memory cost and transfer data is considered. Speed-up, efficiency and scalability of the code are analyzed.%Ekstrakcja równoległości w postaci niezależnych fragmentów kodu pozwala wygenerować równoległe pętle programowe w sposób automatyczny. Kod taki umożliwia wykorzystanie mocy obliczeniowej maszyn równoległych, w tym wieloprocesorowych kart graficznych. W niniejszym artykule poddano analizie zastosowanie algorytmów wyznaczania fragmentów kodu dla aplikacji dedykowanych dla procesorów graficznych. Zbadano przyspieszenie i efektywność obliczeń oraz skalowalność wygenerowanego kodu równoległego.

机译：提取免同步切片可自动生成并行循环。该代码可以在较短的时间内在多处理器计算机上执行。切片技术还可以生成并行代码，以用于通用计算中的图形处理。如今，图形卡支持执行多线程应用程序。 GPU系统由数十或数百个处理器组成。 CUDA（计算统一设备架构的缩写）是NVIDIA开发的并行计算架构。软件开发人员可以通过各种行业标准编程语言来访问图形处理单元（GPU）。使用CUDA，可访问最新的NVIDIA GPU，以进行CPU等计算。用于GPU计算的模型是在异构协同处理计算模型中一起使用CPU和GPU。应用程序的顺序部分在CPU上运行，而计算密集型部分则由GPU加速。从用户的角度来看，该应用程序运行得更快，因为它利用GPU的高性能来提高性能。在本文中，检查了用于生成图形卡并行代码的切片算法。给出了代码的简短示例。解释了CUDA语句和技术。考虑内存成本和传输数据。分析了代码的提速，效率和可扩展性。 Kod takiumożliwiawykorzystanie mocy obliczeniowej maszynrównoległych，w tym wieloprocesorowyy kart graficznych。 W niniejszym artykule poddano analizie zastosowaniealgorytmówwyznaczania片段– kodu dla aplikacji dedykowanych dlaprocesorówgraficznych。 Zbadano przyspieszenie iefektywnośćobliczeńorazskalowalnośćwygenerowanego kodurównoległego。

著录项

来源
《Pomiary Automatyka Kontrola》 |2011年第8期|p.963-965|共3页
作者
Włodzimierz BIELECKI; Marek PAŁKOWSKI;
展开▼
作者单位

KATEDRA INŻYNIERII OPROGRAMOWANIA, WYDZIAŁ INFORMATYKI, ZACHODNIOPOMORSKI UNIWESYTET TECHNOLOGICZNY ul. Żołnierska 49, 71-210 Szczecin;

KATEDRA INŻYNIERII OPROGRAMOWANIA, WYDZIAŁ INFORMATYKI, ZACHODNIOPOMORSKI UNIWESYTET TECHNOLOGICZNY ul. Żołnierska 49, 71-210 Szczecin;

展开▼
收录信息
原文格式 PDF
正文语种 pol
中图分类
关键词
automatyczne zrównoleglanie pętli; fragmenty kodu,GPU; CUDA; OpenCL; obliczenia wysokiej wydajności;

机译：自动循环;代码段;GPU;CUDA;OpenCL;高性能计算;

相似文献

外文文献
中文文献
专利

1. Zastosowanie przetwarzania równoległego w procesorach graficznych do szybkiej estymacji wskaźnika wielorozdzielczego podobieństwa strukturalnego dla celów oceny jakości obrazów cyfrowych [J] . Przemysław MAZUREK, Krzysztof O KARMA Pomiary Automatyka Kontrola . 2011,第8期

机译：在图形处理器中使用并行处理快速评估多分辨率结构相似性指标，以评估数字图像的质量
2. Prywatyzacja zmiennych skalarnych dla wyznaczania równoległości w pętlach programowych [J] . Marek PAŁKOWSKI, Włodzimierz BIELECKI Pomiary Automatyka Kontrola . 2012,第2期

机译：标量变量的私有化，用于确定程序循环中的并行性
3. Implementacja oraz porównanie algorytmów tekstowych w środowiskach przetwarzania równoległego na przykładzie procesorów wielordzeniowych i kart graficznych [J] . Marcin PIETROŃ, Maciej WIELGOSZ, Kazimierz WIATR Pomiary Automatyka Kontrola . 2014,第5期

机译：以多核处理器和图形卡为例，在并行处理环境中实现和比较文本算法

Wyznaczanie równoległości pętli programowych w aplikacjach dedykowanych dla procesorów graficznych

摘要

著录项

相似文献

相关主题

期刊订阅