学部新闻

智能与计算学部留学生发表高水平会议论文

2021年08月03日 10:29

(通讯员 李爽)近日,智能与计算学部埃塞俄比亚籍博士留学生索安(Sofonias Yitagesu)使用无监督方法提取重要漏洞概念这一工作取得突破性进展,工作成果于被软件工程领域顶级会议IEEE/ACM自动化软件工程国际会议(ASE,CCF A类会议)顺利接收,索安同学为第一作者[1]。此外,索安同学还于今年5月份在IEEE挖掘软件库会议(MSR,CCF C类会议)上发表论文一篇[2]

1.png

图1 CaVAE模型训练过程中损耗值的变化

2.png

图2 三个实验环境中团簇的二维可视化

索安同学提出了一种无监督的方法来标记和提取文本漏洞描述中的重要漏洞概念。该方法基于一个关键的观察,即相同类型的短语,无论它们在句子结构和短语表达上如何不同,通常在句子分析树中共享句法相似的路径。因此,提出了两种路径表示(绝对路径和相对路径),并使用自动编码器来编码这种语法相似性。图1显示了CaVAE模型在绝对路径和相对路径的训练过程中,损耗值随迭代次数的变化情况。图1(左)显示温度参数τ从0.981逐渐降低到0.5。在图1(右)中,红线代表模型损失,蓝线代表验证损失。总的来说,当模型迭代到近5000步时,重建误差被优化为较小。以上结果表明,所提出的CaVAE在验证集上实现了较小的对数似然,证明了该模型对提高潜在空间聚类质量的有效性。图2显示了在三个实验环境中获得的团簇的二维可视化。尽管在不同的设置中,生成的聚类的形状和位置是不同的,但可以清楚地观察到在所有三个设置中,四个主要的聚类的离群值的百分比都非常小。在可视化图中,红色点对应根本原因,玫瑰点对应影响,黄色点对应攻击向量,绿色点对应其他类型,黑点是异常值。

3.jpg

索安同学是学部软件工程专业2017级博士生,他于2017年9月份进入数据智能与云边端服务工程课题组开展科研工作,指导教师为冯志勇教授和张小旺副教授,在两位老师的指导下,索安同学一直致力于“基于知识图谱的网络安全漏洞”课题的研究。“导师们给我提供了很大的帮助和支持,培养我在科技写作、口头报告、问题定义、统计数据分析和批判性文献综述等各方面的学术能力。”索安如是说。“两位老师指导我了解目标并制定工作计划,提供充足科研空间和服务器资源来支持我。在我对自己的科研工作能力建立信心之后逐步培养自主科研能力,使我独立科研能力得到进一步提升。”索安同学表示他很感激两位导师以及天津大学其他老师们对其在校学习科研期间等各方面的帮助与支持,老师们的交流互动与指导使其受益匪浅。

论文信息:

[1]Sofonias Yitagesu, Zhenchang Xing, Xiaowang Zhang, Zhiyong Feng, Xiaohong Li, Linyi Han.Unsupervised Labeling and Extraction of Phrase-based Concepts in Vulnerability Descriptions. ASE2021.

[2]Sofonias Yitagesu, Xiaowang Zhang, Zhiyong Feng, Xiaohong Li, Zhenchang Xing.Automatic Part-of-Speech Tagging for Security Vulnerability Descriptions.MSR 2021: 29-40.

扫码关注微信公众号

联系我们

地址:天津市津南区海河教育园区雅观路135号天津大学北洋园校区55教学楼,300350
邮箱:coic@tju.edu.cn

Copyright ©2017 天津大学智能与计算学部 版权所有