机译:在GPU上优化深度可分离的卷积操作
Harbin Inst Technol Sch Cyberspace Sci Harbin 150000 Peoples R China;
Harbin Inst Technol Sch Cyberspace Sci Harbin 150000 Peoples R China;
Univ Leeds Sch Comp Leeds LS2 9JT W Yorkshire England;
Convolution; Graphics processing units; Instruction sets; Kernel; Standards; Training; Registers; Performance optimization; convolution; depthwise; pointwise; memory optimization; GPU utilization;
机译:基于深度扩张可分离卷积的轻质和高效的深卷积神经网络
机译:IoT使能深度可分离的卷积神经网络,深载向量机用于Covid-19诊断和分类
机译:动态数据流调度和计算映射技术,用于高效的深度可分离卷积加速度
机译:用于CNN推理加速器的深度可分离卷曲的数据位置优化
机译:深空和时间可分离卷积神经网络的一体化算法/架构共设计
机译:基于密集连接深度可分离卷积深网络的关节光盘和杯分割
机译:基于深度可分离的卷积神经网络的水下声学目标识别
机译:求解可分离和部分可分非线性优化问题的原始方法和对偶方法的比较研究