机译:为Fermi GPU自动调整GEMM内核
University of Tennessee, Knoxville;
BLAS; CUDA; GEMM; Graphics processing unit; automatic tuning; code generation; matrix multiplication;
机译:用于多个小型矩阵的NVIDIA GPU上的GEMM接口和实现
机译:自动调整配置以在GPU中执行程序
机译:自动优化矩阵乘法以减少GPU上的能量的经验
机译:用于GPU的批处理GEMM的性能,设计和自动调整
机译:自动调整,代码生成并优化GPU的编译器技术。
机译:在CPU / GPU系统上重新定位分子动力学:水核和摇动并行化
机译:自动调整Fermi GPU的gemm内核