2023年5月,国际程序理解会议(ICPC 2023)在澳大利亚墨尔本举办。bwin必赢软件研究所的一篇论文《Implant Global and Local Hierarchy Information to Sequence based Code Representation Models》获得该奖项。该论文作者为北京大学博士生张克驰、硕士生李拙以及指导老师金芝教授和李戈教授。
ACM SIGSOFT杰出论文奖是由ACM SIGSOFT设立的论文奖项,用于奖励软件工程顶级会议上不超过10%的优秀论文。
本次获奖的论文提出了一种性能优异的程序表示方法,为解决多种软件工程下游任务提供了强大的基础模型。该工作将结构信息融入代码序列的程序表示模型,提出了一种基于Transformer的树表示模型,通过分析抽象语法树上的层次结构信息,在序列模型中嵌入一个层次模型来处理代码的层次结构信息,并将其融入代码序列的向量表示。该工作在代码分类、克隆检测、方法名生成等三种不同的下游任务共8种主流数据集上进行了广泛的实验,结果表明,该方法由于融合了层次结构信息,因而具有更好的性能和训练稳定性,且所增加的训练代价和参数量极少。
这是金芝教授和李戈教授团队第三次获得ICPC会议的ACM SIGSOFT杰出论文奖。此前,以胡星博士为第一作者的文章《Deep Code Comment Generation》和以刘芳博士为第一作者的文章《A Self-Attentional Neural Architecture for Code Completion with Multi-Task Learning》分别获得了ICPC 2018和ICPC 2020的ACM SIGSOFT杰出论文奖。