您现在的位置:首页>中文会议>2017年全国高性能计算学术年会

会议信息

  • 会议名称:

    2017年全国高性能计算学术年会

  • 召开年: 2017
  • 召开地: 合肥
  • 会议文集: 2017年全国高性能计算学术年会 论文集
  • 主办单位: 中国计算机学会
  • 出版时间: 2017-10
  • 排序:
  • 显示:
  • 每页:
全选(0
<2/2>
30条结果
  • 摘要:高性能计算机硬件的快速发展带来了体系结构的高复杂性,对使用者利用好当代超算资源提出了更高要求.在工程实际和科学实验中,为完成某一专题作业,往往需要使用多种应用软件相互协作,在HPC环境中使用科学工作流技术集成相关业务软件,构建业务流程能够有效提升工作效率.本文描述了一种部署在HPC环境下的科学工作流应用平台,对平台中的引擎设计和资源调度方式进行了阐述,分析了引擎设计和资源调度的需求,设计了针对有向无环图(DAG)的并发异步流程执行引擎,采取调度算法和调度器、引擎相分离的设计策略,有利于算法扩展和引擎独立发展.基于科学工作流的调度问题一般抽象为DAG的调度,针对调度的资源供给问题提出了局部资源池化技术和资源预约算法,有效提升了工作流的整体执行性能;针对启发式调度算法,比较分析了五种常用调度算法的性能,给出了算法选择的建议.引擎和调度方案已在高性能科学工作流应用平台HSWAP中得到实际应用.
  • 摘要:随着高通量测序技术的广泛应用,基因数据不断增长,十万人,甚至百万人规模的全基因组关联研究也从理论进入实验阶段.然而,要并行访问这些接近PB级的基因数据,却存在着严重的性能瓶颈,包括数据存放和访问方式的矛盾,海量文件读写带来的元数据拥堵等,本文提出基于HDF5的数据并行处理框架,通过数据分片,将数据片作为矩阵元素实现转置,解决数据局部性矛盾,改善了数据访问的连续性,同时结合基因关联分析这类计算的特点,采取数据过滤、类型转换、列存储压缩等方法进一步减少开销,最终将数据访问性能提升了10倍以上,计算扩展性也得到极大提升.
  • 摘要:随着片上多处理器系统核数的增加,当前一致性协议上存在的许多问题使共享存储系统复杂而低效.目前一些一致性协议极其复杂(如MESI协议),存在众多的中间状态和竞争.并且这些协议还会导致额外失效通信,以及大量记录共享信息的目录存储开销(目录协议)或广播消息的网络开销(监听协议).本文对数据无竞争的程序实现了一种简单高效一致性协议VISU,这种协议基于自更新操作(Self-Updating)、只包含两个稳定状态(Valid/Invalid).所设计的两状态VISU协议消除了目录和间接事务.首先基于并行编程的数据无竞争(DRF)模型,采用在同步点进行自更新共享数据来保证正确性.其次利用动态识别私有和共享数据的技术,提出了对私有数据进行写回,对共享数据进行写直达的方案.对于私有数据,简单的写回策略能够简化不必要的片上通信.在L1cache中,对于共享数据的写直达方式能确保LLC中数据最新从而消除了几乎所有的一致性状态.实现的VISU协议开销低、不需要目录、没有间接传输和众多的一致性状态,且更加容易验证,同时获得了与MESI目录协议几乎相当甚至更优的性能.
  • 摘要:针对二进制翻译系统QEMU在寄存器分配时未考虑基本块之间以及循环体之间对寄存器需求的差异,造成不必要的寄存器溢出而导致的冗余访存开销问题,引入全局寄存器静态分配和局部寄存器动态分配思想,提出高效的基于优先级的动静结合寄存器分配优化算法.该算法首先基于源平台不同寄存器使用的统计特征和各变量的生命周期,静态进行全局寄存器分配;然后依据中间表示与源平台寄存器之间的映射关系,获取基本块中间指令需求寄存器次数并排序确定寄存器分配的优先级;然后依据优先级顺序动态进行寄存器分配,从而减少寄存器溢出次数,降低生成的本地代码的膨胀率以及访存次数,提高目标程序性能.对nbench、典型的递归程序和SPEC2006的测试表明,该算法有效减少了本地代码的访存次数,提高了程序性能,平均比优化前性能分别提升了8.56%、8.14%、8.01%.
  • 摘要:迭代计算是数值计算中有效的逼近方式,能够拟合多种计算模型.在大数据分析领域尤其是图计算中,迭代计算能够抽象描述大部分图算法,对结构化数据挖据和关联分析至关重要.随着数据规模的增长,很多精确算法的时空复杂度已经难以满足现实需求,迭代计算的算法越来越丰富.并行迭代是图计算的主要实现形式,已有的图并行策略大多数是同步模型,少量异步模型,对于一致性约束条件下的迭代研究较少.本文重点讨论图计算模型中迭代执行技术,分析了同步迭代和异步迭代的适用性,以及不同一致性下的异步迭代方式,针对已有异步迭代方式的不足提出了自适应的弱一致异步执行模型,并进行了验证性实验.实验证明,该模型能有效提高部分图算法的执行效率,尤其是收敛速度和效果.
  • 摘要:MPI已经成为高性能计算编程模型的事实标准,但其丰富灵活的接口语义使得程序易于出现通信死锁,严重影响系统的可用性,然而,现有的MPI通信死锁检测工具可扩展性不高,难以适应持续扩大的系统规模.为此,本文提出一种MPI运行时的通信死锁检测框架MPI-RCDD,该框架包含三种主要机制.首先,MPI-RCDD设计实现与死锁检测相适应的消息日志协议,确保死锁检测必需的通信消息不丢失;其次,使用MPI环境提供的消息异步处理线程实现进程之间依赖关系的传递,使得众多进程能够同时参与死锁检测工作,缓解集中式分析的性能瓶颈问题;此外,提出一种基于AND(+)OR模型的死锁分析算法AODA,该算法将基于消息超时和基于依赖关系两种死锁分析方式相结合,能够在超时等待进程之间的依赖关系传递过程中搜索死锁环或结,准确定位引发死锁的进程并且不会产生误报.在Umpire Test Suit等典型MPI通信死锁测试程序上的实验结果验证了MPI-RCDD框架的有效性,同时,在NPB基准测试程序上的实验获得了令人满意的性能开销,表明本文提出的MPI-RCDD框架具备较强的可扩展性.
  • 摘要:为进一步提升网络性能,处理器内集成网络设备逐渐成为趋势,但随着片上处理器数目、以及高维度系统域网络对片间互连端口数目需求的不断增加,传统的集成集中式Router的结构(如IBM Bluegene/Q)将面临可扩展性、片上流量均衡及片间接入公平性等问题.本文提出了片上网络和片间系统域网络协同设计思路,以分布式的虚拟Router架构替代传统集中式的Router架构,一方面通过将片间网络接口分布在片上网络,为处理器核提供均衡、公平的网络服务,另一方面省去了集中式Router中的交叉开关,进而消除了片间交换的扩展性限制,降低了CPU集成片间网络设备的成本.本文从协同路由、协同网络接口布局和协同参数设置三个方面对该协同设计方法进行了系统性的探索,并通过对TMesh网络架构进行实例研究,给出了虚拟Router架构的性能和可行性分析.
  • 摘要:数字信号处理器(DSP)广泛应用于各类工业领域和军事装备领域,OpenCV是业界通用的开源图像处理算法库,但目前鲜有针对DSP平台的OpenCV移植和优化实现.本文在TI公司TMS320C6678DSP平台上实现了OpenCV的移植,生成了支持绝大多数OpenCV功能的TI6678底层支持库.在此基础上,本文深入分析了一类OpenCV库函数在TI6678硬件平台运行的计算特征和数据流,提出了一种针对这类OpenCV库函数的优化方法,将TI6678体系结构支持的DMA和Cache操作与OpenMP并行框架高效结合,实现这类OpenCV库函数在TI6678芯片上的优化和多核并行.依据本文的方法,优化改造的OpenCV库函数在TI6678上单核运行性能最多可提升3.6倍,在单核优化基础上并行改造的这类库函数8核加速比在2.55到7.06之间.
  • 摘要:互联网技术的飞速发展使得文本数据呈指数级增长,如何有效分析和利用这些数据,充分发掘其中蕴含的价值是文本大数据分析处理的首要任务,而这其中针对文本的分类处理是一个重要分支.文本分类是一种有监督的学习过程,通过大量标注数据训练分类模型,实现基于文本内容按预先设定的分类体系自动确定文本类别.传统基于词嵌入技术的神经网络文本分类方法由于未充分考虑文本内容的全局特征,存在分类效果不佳等问题.因此,文中提出一种综合文本局部特性(词嵌入技术)和文本内容全局特征(主题嵌入技术)的文本表示方法,并在此基础上通过构造多层神经网络,实现对文本的自动分类.在诸如情感分析、主题分类等多种文本分类任务数据集上的测试结果表明,本文所提方法相较于传统基于词嵌入技术的文本分类方法有明显提升.
  • 摘要:海洋数据同化是指将海洋观测数据与数值模型进行融合,并从大量海洋观测数据中提取有价值信息,因此对人类理解和认识海洋具有重要意义.在海洋数据同化中,常用的方法是基于集合卡尔曼滤波的集合最优插值.相比集合卡尔曼滤波,集合最优插值在数值计算效率上更加高效,但在该方法中SVD分解被用来实现矩阵求逆,由于SVD分解的算法复杂度较高,所以程序的求逆过程十分耗时.本文将对集合最优插值中逆矩阵的计算过程进行优化,分别使用LU分解、Choleskey分解、QR分解来替代SVD分解.首先,通过LU分解,(Choleskey分解,或QR分解)得到相应的三角矩阵(或正交矩阵);然后,利用分解后的矩阵来实现相关逆矩阵的计算.由于LU分解、Choleskey分解、QR分解的算法复杂度都远小于SVD分解,因此改进后的同化程序将能得到大幅度的性能提升.数值结果表明,本文中所采用的三种矩阵分解方法相比于SVD分解,都提升了集合最优插值的计算效率至少两倍以上.值得一提的是,在四种矩阵分解中Choleskey分解使得整个同化程序的性能达到了最优.

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号