(通讯员 李娜)近日,学部可视计算团队林迪副教授(第一作者)、冯伟教授(通讯作者)等人撰写的论文“TAGNet: Learning Configurable Context Pathways for Semantic Segmentation”被人工智能领域国际顶级期刊IEEE Transaction on Pattern Analysis and Machine Intelligence(IEEE TPAMI)录用。该期刊科学引文索引影响因子为16.39,是计算机工程、电子工程及人工智能领域最为重要的期刊之一。团队关于计算机图像语义分割的相关工作也先后发表在TPAMI、CVPR、ICCV、ECCV、NeurIPS等会议和期刊上。
图1 TAGNet与已有典型深度学习方法的不同之处
该论文从图结构的角度来解释像素间的语义关系,对近六年的图像语义分割的典型深度学习方法,例如PSPNet、Deformable CNN、PSANet(non-local CNN)、CCNet、ASPP等做了系统性总结。针对已有深度学习方法面向多尺度像素语义关系建模的不足之处,提出可动态调整路径的语义分割网络TAGNet,并在多个公开数据集取得良好性能。
图2 TAGNet的网络结构
论文具体信息:
Di Lin, Dingguo Shen, Yuanfeng Ji, Siting Shen, Mingrui Xie, Wei Feng, and Hui Huang. TAGNet: Learning Configurable Context Pathways for Semantic Segmentation. IEEE TPAMI, 2022.