机译:基于CUDA平台的EBE-FEM的并行实现与分支优化
Shenyang Univ Technol Sch Elect Engn Shenyang 110870 Peoples R China;
Shenyang Univ Technol Sch Elect Engn Shenyang 110870 Peoples R China;
Shenyang Univ Technol Sch Elect Engn Shenyang 110870 Peoples R China;
Shenyang Univ Technol Sch Elect Engn Shenyang 110870 Peoples R China;
Shenyang Univ Technol Sch Elect Engn Shenyang 110870 Peoples R China;
Shenyang Univ Technol Sch Elect Engn Shenyang 110870 Peoples R China;
Branch optimization; CUDA; EBE-FEM; parallel computation;
机译:将程序分支概率用于CUDA平台上分支分歧的线程并行化
机译:并行稀疏方程和最小二乘(LSQR)的MPI-CUDA实现和优化
机译:基于压缩的扫描设计中基于CUDA的测试矢量编码算法的并行实现
机译:在CUDA平台上实现的并行算法对数据进行排序
机译:用于将算法和应用程序映射到CUDA GPU平台和CPU-GPU异构平台的优化技术。
机译:基于张量的基于CUDA优化的嵌入式GPU上的并行加速用于神经网络推理
机译:并行稀疏方程和最小二乘(LSQR)1的MPI-CUDA实现和优化