2016年11月26日,中国计算机学会计算机视觉专委会(CCF-CV)走进高校系列报告会第24期活动—“计算机视觉前沿技术及应用”在天津大学北洋园校区成功举行。
本期报告会邀请了四川大学吕建成教授、南京大学吴建鑫教授、中山大学郑伟诗教授以及西北工业大学的韩军伟教授做专题报告。天津大学计算机科学与技术学院胡清华教授主持了本次活动。
来自四川大学的吕建成教授的报告题目为“神经网络方法”。该报告介绍了神经网络的基本概念,梳理了神经网络发展的历史脉络,阐述了神经网络的关键基础理论,并讨论了神经网络与类脑研究,神经网络与大数据分析的关系。报告同时展示了研究团队利用深度学习实现诗词自动生成、四川话语音识别以及人工智能游戏等方面的典型应用。
来自南京大学的吴建鑫教授带来了题为“细粒度图像分析”的报告。吴教授以哈士奇和爱斯基摩犬的分类为例,引入了细粒度图像分类的概念。同时介绍了细粒度图像分析的目的、意义、应用及其所在团队在这方面的一些工作,包括弱监督的细粒度图像分类以及无监督的细粒度图像定位与检索。最后,吴教授对细粒度图像分类的研究趋势进行了展望,包括更细粒度的图像分析问题,以及利用更多图像全局特性和分类先验的细粒度分类框架。
来自中山大学的郑伟诗教授的报告题目为“视频监控下的交互行为分析研究”。该报告介绍其所在的研究组近年在人物交互行为和多人交互行为分析的研究 (ICCV 2013、IEEE TCSVT 2015、CVPR 2015、 ECCV 2016),主要包括基于模板学习的人物交互行为分析、基于RGB-D的异质特征数据融合的人物交互行为分析与预测、基于广义相似性函数的人与人交互建模的多人交互行为分析学习模型。本次报告也介绍了研究组建立的两个新数据库,包括SYSU Action dataset以及SYSU 3D HOI数据库。
来自西北工业大学的韩军伟教授带来了题为“视觉显著性计算及应用”的报告。本报告首先将简单介绍视觉注意机制的工作原理和研究进展;其次详细介绍视觉显著性计算技术的基本原理、实现方法、关键技术、难点问题、最新进展,以及研究组在这一研究方向上的一些创新工作;最后展示显著性分析在图像/视频检索、压缩、传输、摘要、分类、监控、人机交互等方向的一些应用。在总结和展望中,韩教授认为工业界对于注视点预测的应用需求很多,目前实际应用仍多依赖于眼动仪,同时计算机视觉技术现状目前无法model top-down attention,准确率与速度都与实际应用需求有距离。此外,目前大多研究基于几个较为简单的测试数据库,需要针对实际复杂的应用数据进行实验。针对以上问题,Deep learning结合大数据也许是一条解决视觉显著性计算的新途径。
在报告提问环节,同学们就自己感兴趣的问题向主讲人进行了提问,四位主讲人对同学们的提问进行了详细的解答。活动结束后,大家一同合影留念。
部分参会人员合影留念