2019 年12月16日至12月18日,第17届IEEE并行和分布式处理及其应用国际研讨会(ISPA)在福建厦门举行。研究组在本次会议上发表学术论文“Fast Schedule Tensor Computation on GPU for High Data Reuse and Device Utilization”(作者为:张宇翔、张昱),由研究组成员张宇翔参会做展示。
该论文针对张量计算GPU算子优化问题提出一种高效的自动调优算法。具体地,针对给定的GPU模型,设计综合数据局部性、负载均衡和计算并行性的经验模型,利用该模型来评估候选张量计算任务调度的质量;再引入经验约束,使候选调度的搜索空间显著降低到多项式复杂度。与最先进的Tensor Comprehensions相比,该算法以5-45倍更快的调优速度找到运行速度快1.5-10倍的计算调度。