(通讯员 陈俊洁)10月25日至28日,第32届软件可靠性工程国际会议The 32ndInternational Symposium on Software Reliability Engineering (ISSRE 2021)在中国武汉举办。智能与计算学部软件工程团队的论文《How Long Will it Take to Mitigate this Incident for Online Service Systems?》荣获ISSRE 2021唯一最佳论文奖(Best Research Paper Award)。该工作由天津大学智能与计算学部软件工程团队与微软亚洲研究院合作完成,其中第一作者为学部2019级硕士生王维靖,指导教师为陈俊洁副教授(第二作者),学部2021级博士生杨林为第三作者,其他合作作者包括:纽卡斯尔大学Hongyu Zhang教授、微软亚洲研究院副院长张冬梅博士、首席研究员林庆维,以及赵普、乔波、康昱三位研究员;还包括Microsoft 365的Saravanakumar Rajmohan,Microsoft Azure的Feng Gao、Zhangwei Xu以及Yingnong Dang。
线上颁奖截图
据悉,ISSRE是软件可靠性领域的旗舰会议,专注于评估、预测和改善软件产品可靠性、安全性,包括前沿理论方法与创新技术工具等,同时也是中国计算机学会推荐国际学术会议(软件工程、系统软件与程序设计语言)B类会议(CCF-B)。
现场展示
该篇论文是AIOps领域首个研究云服务系统异常恢复时间的工作。为了减少服务中断时间,并保证服务的高质量运行,需要及时缓解在线服务系统中的异常(incident)。对异常缓解时间进行预测可以帮助提高团队运维的工作效率,由于在线服务系统的异常与传统软件缺陷的特点不同,因此针对传统软件缺陷修复的时间预测方法并不能应用于本场景。
最佳论文奖
该工作在微软的20个在线服务系统上对在线服务系统异常的缓解进行实证研究,并进一步提出一种在连续分配场景中预测异常缓解时间的深度学习方法,名为TTMPred。该方法在微软的4个大型在线服务系统的异常数据上进行了实验,结果表明本方法显著优于其他对比方法。
TTMPred方法示意图