学部新闻

学部硕士生论文被国际数据库顶级会议ICDE 2022录用

2022年03月25日 09:52

(通讯员 李娜)近日,学部数据库课题组硕士生董思聪以第一作者撰写的论文“Communication-Efficient Knowledge Graph Embedding Training with Hot-Embedding Caching”被国际数据库顶级会议ICDE 2022长文录用,指导教师为王鑫教授。

ICDE 2022会议的全称是38th IEEE International Conference on Data Engineering(第38届IEEE国际数据工程大会),将于2022年5月9日至12日在马来西亚吉隆坡以线上会议形式召开。ICDE是数据库领域最权威的国际顶级学术会议之一,是CCF推荐的A类会议,与SIGMOD、VLDB并称为数据库领域的国际三大顶会。

undefined

本次录用的论文在传统的参数服务器架构基础上,基于参数访问的局部性特性提出了知识图谱嵌入分布式训练的新方法,引入了面向高频关键嵌入的优化缓存结构,设计了自适应的预取和过滤算法用于构建关键嵌入表,并提供了静态和动态两种关键嵌入表构建策略;采用有界延迟技术,通过轻量级同步来缓解收敛过程中的参数不一致问题;同时,实现了分布式知识图谱嵌入系统HotKE,与现有系统相比,HotKE在不牺牲训练准确率的基础上,大幅减少了大规模知识图谱嵌入分布式训练中的通信开销,为支持基于大规模知识图谱的表示学习提供了有效途径。

undefined

基于关键嵌入的分布式知识图谱嵌入训练方法

undefined

自适应的预取和过滤算法

该论文的研究工作由天津大学、北京大学和澳大利亚迪肯大学合作完成,其中天津大学智能与计算学部2019级硕士生董思聪和2020级硕士生柳鹏凯分别为第一作者和第三作者,学部王鑫教授为论文通讯作者。董思聪同学师从王鑫教授,经过两年多系统的科研训练,取得了多项成果。除上述ICDE论文录用之外,还以第一作者在CCF推荐B类会议DASFAA 2020上发表长文1篇。

相关论文信息:

[1] Sicong Dong, Xupeng Miao, Pengkai Liu, Xin Wang, Bin Cui, Jianxin Li. Communication-Efficient Knowledge Graph Embedding Training with Hot-Embedding Caching. The 38th IEEE International Conference on Data Engineering (ICDE 2022, Research Track).

[2] Sicong Dong, Xin Wang, Lele Chai, Jianxin Li, Yajun Yang. PDKE: An Efficient Distributed Embedding Framework For Large Knowledge Graphs. The 25th International Conference on Database Systems for Advanced Applications (DASFAA 2020).

扫码关注微信公众号

联系我们

地址:天津市津南区海河教育园区雅观路135号天津大学北洋园校区55教学楼,300350
邮箱:coic@tju.edu.cn

Copyright ©2017 天津大学智能与计算学部 版权所有