您现在的位置: 首页> 研究主题> 异构计算

异构计算

异构计算的相关文献在1995年到2023年内共计414篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、经济计划与管理 等领域,其中期刊论文204篇、会议论文14篇、专利文献391594篇;相关期刊122种,包括数字家庭、电子学报、电子产品世界等; 相关会议14种,包括2016年全国计算机体系结构学术年会 (ACA2016)、2014年全国开放式分布与并行计算学术年会、第十七届计算机工程与工艺年会暨第三届微处理器技术论坛等;异构计算的相关文献由1025位作者贡献,包括曾国荪、陆鑫达、于治楼等。

异构计算—发文量

期刊论文>

论文:204 占比:0.05%

会议论文>

论文:14 占比:0.00%

专利文献>

论文:391594 占比:99.94%

总计:391812篇

异构计算—发文趋势图

异构计算

-研究学者

  • 曾国荪
  • 陆鑫达
  • 于治楼
  • 姜凯
  • 侯彪
  • 柴志雷
  • 焦李成
  • 陈继承
  • 刘顺宗
  • 张立群
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 潘妍; 程岳; 高雅濛
    • 摘要: 近年来,现场可编程门阵列(field programmable gate array,FPGA)凭借其灵活性、低功耗等特点吸引了工业界和学术界的广泛关注与应用,随着硬件发展增速变缓,摩尔定律失效,异构计算以不可阻挡的趋势成为当前热门领域。高层次综合技术有效地解决了在异构计算形势下,如何以软硬件协同方式进行开发,如何降低软件算法开发人员使用硬件设计的学习门槛,如何加速系统开发过程中的快速原型迭代等诸多问题。高层次综合技术能够将高层次语言描述的逻辑结构自动转换为低抽象级语言描述的电路模型,使得硬件开发具有了更高的灵活性和高效性。高层次综合技术经历了长期的探索,从高层次综合技术出现的背景和需求为出发点,介绍其早期发展历史,涉及的关键基础技术和优化方法,并对影响力较大的技术工作做以总结,最后提出未来的展望与挑战。
    • 龚施俊; 鄢贵海; 李晓维
    • 摘要: 在数据高速增长的背景下,异构计算作为满足新兴应用不断提高的算力需求的有效途径,涌现了许多异构加速系统。在这些异构加速系统中,高效的任务映射是充分发挥加速器潜能提升应用程序性能的关键之一。先前工作提出了许多基于有向无环图如何最小化应用程序整体执行时间和最小化异构多处理器之间通信开销等高效的任务映射方法,这些工作通常采用将任务映射到加速器上来提高整个应用的性能。但某些应用程序如果将所有子任务全部映射到加速器上执行,会带来额外的通信开销,进而可能达不到提升性能的预期,甚至造成整个应用程序的性能下降。因此,本文提出了一种基于预测的主动式任务映射算法(PPTM)来应对这样的场景,实现高效的任务映射。实验表明,本文算法能够更准确感知计算任务的运行时状态,大幅提高应用程序的整体性能。
    • 王若天; 沙金
    • 摘要: 由于非结构化的低密度奇偶校验码(LDPC)具有更优异的纠错性能而受到广泛关注,但其非零元素分布较不规律且没有循环或准循环的子矩阵的构造方式,增加了译码器实现的设计难度.本文提出了基于CUDA的译码器设计,用于支持任意非结构化LDPC码的高吞吐量并行译码.利用校验矩阵压缩重排、优化信息存储等手段,设计实现GPU上高效的并行译码内核进行多帧译码.在GTX1660Ti GPU平台上的结果表明,基于TPMP流程的LLR-BP和NMSA译码内核设计吞吐量可分别达到78.88~360.25 Mbps和174.38~1323.75 Mbps,实现了面向任意非结构化LDPC码的高效并行译码.
    • 宁成明; 蔡恒雨; 郑启龙; 耿锐
    • 摘要: 由于CPU在处理海量数据时所面临的性能瓶颈,使得基于异构系统的异构并行计算成为并行计算领域的研究热点之一.HXDSP是中国电子科技集团第三十八所自主研制的DSP芯片,能满足多种高性能计算领域的需求.为了充分发挥HXDSP的计算能力以及多HXDSP设备并行计算的能力,本文设计了基于OpenCL的HXDSP异构计算框架.本文根据计算任务的特性设计了不同的OpenCL设备映射方式,使得HXDSP异构计算框架能适应不同的应用场景,充分利用HXDSP的计算资源并节省能耗.本文在HXDSP异构计算框架设计完成的基础上针对HXDSP异构计算应用程序进行优化,包括数据传输优化和数据访问优化.最后本文通过实验分析了HXDSP异构计算框架的程序性能,验证了HXDSP异构计算框架的可行性以及有效性.
    • 凤雷; 王宾涛; 刘冰; 李喜鹏
    • 摘要: 深度强化学习(DRL)是机器学习领域的一个重要分支,用于解决各种序贯决策问题,在自动驾驶、工业物联网等领域具有广泛的应用前景;由于DRL具备计算密集型的特点,导致其难以在计算资源受限且功耗要求苛刻的嵌入式平台上进行部署;针对DRL在嵌入式平台上部署的局限性,采用软硬件协同设计的方法,设计了一种面向DRL的FPGA加速器,提出了一种设计空间探索方法,在ZYNQ7100异构计算平台上完成了对Cartpole应用的在线决策任务;实验结果表明,研究在进行典型DRL算法训练时的计算速度和运行功耗相对于CPU和GPU平台具有明显的优势,相比于CPU实现了12.03的加速比,相比于GPU实现了28.08的加速比,运行功耗仅有7.748 W,满足了深度强化学习在嵌入式领域的在线决策任务。
    • 张乾; 梁亮; 宋佩涛; 李颂
    • 摘要: ALPHA是哈尔滨工程大学核动力仿真研究中心研发的基于异构系统的三维高保真堆芯中子输运计算程序。ALPHA程序基于性能优化的二维特征线装载图形处理单元(GPU)并行计算核心,基于MPI+CUDA混合编程模型实现粗细粒度的异构系统多节点并行并应用通信掩盖优化。ALPHA的共振计算模型采用原创的细群-子群二级离散策略并采用多群求解核心适配异构系统。ALPHA采用MOC-EX实现三维全堆芯中子输运异构并行计算及GPU并行的粗网有限差分加速。数值结果表明,ALPHA程序在保证计算精度的前提下,具备较高的并行效率和一定的可扩展性,有望实现数值反应堆中中子学计算的轻量化与工程化应用。
    • 李新亮
    • 摘要: 简介了超级计算(大规模并行计算)的基本概念及软硬件体系,结合笔者经历回顾了近20余年我国超级计算的发展。简要介绍了异构并行计算的基本概念以及并行计算的基本编程方式。
    • 刘婷
    • 摘要: 【本刊讯】近日,工业AR应用解决方案供应商ALVA Systems(中文名:阿依瓦(北京)技术有限公司)完成B轮数亿元融资。本轮融资由老股东软银中国资本(SBCVC)领投,同时老股东高科新浚以及新股东泰越资本跟投。成立于2011年,ALVA Systems是国内最早,并一直专注与异构计算(HC)应用开发的公司,通过与AMD、Intel、高通、ARM等全球顶级硬件企业的合作,充分积累了技术应用经验。
    • 高昊晖; 樊荣; 缪永杰; 柴志雷
    • 摘要: 针对高速数字喷墨打印对高带宽、低延迟、低抖动的打印数据传输,以及高并发的位操作喷孔控制等需求,设计了一种领域专用SoC架构并实现了软硬件系统.通过StandaloneOS下的轻量级网络传输减少了操作系统带来的传输抖动,保持稳定高速的数据传输;基于片内高速总线提升了主控系统与喷头控制模块之间的传输带宽,降低了信号传递的延迟;通过设计位操作协处理模块,实现了对喷孔阵列的高并发控制.基于ZYNQ7020 FPGA SoC平台实现了上述SoC架构及系统,实验结果表明:该系统从上位机接收打印数据时,采用千兆以太网传输速率可以稳定保持在947 Mbps;片内总线传输带宽可达800 MB/s,指令传输延迟在10 ns内;系统的位操作数据处理频率可达64 MHz;整个系统的数据吞吐率可达1500 Mbit/s,数据传输抖动在20 ns内.该系统可驱动具有30720个喷孔的打印机喷头以600 dpi的打印精度完成200 cm/s的打印工作,在1200 dpi的打印精度下仍表现出优良的性能,为突破高速数字喷墨打印的速度瓶颈提供了新的技术思路.
    • 摘要: Imagination Technologies宣布:携手百度飞桨(PaddlePaddle)及多家合作伙伴共同发起“硬件生态共创计划”,利用自身的优势技术和市场应用经验共同构建高效的软硬一体平台方案,将百度飞桨软件的先进算法和灵活性与Imagination异构计算IP技术相结合,支持下游芯片及应用开发商在此基础上快速创建全面优化的解决方案。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号