学部新闻

IEEE Fellow、微软亚洲研究院语音组首席科学家Frank Soong教授一行到我院进行学术交流

2017年08月31日 00:00

为加强学术交流、开拓国际视野、提高天津大学语音课题组的学术水平,2017年8月14日到8月15日,言语多模态交互及其认知计算团队举办了智能语音处理学术交流以及产教研融合系列活动的第三场——语音处理专题学术讲座。本次学术讲座有幸邀请到了语音研究领域的权威及知名专家、微软亚洲研究院语音组的首席科学家及主管Frank Soong教授,以及他的博士学生解奉龙。

Frank Soong教授长期在贝尔实验室等国际著名研究机构从事语音信号处理的基础理论和应用技术研究,是该领域的国际知名专家。他先后供职于美国贝尔实验室、日本NTT公司和日本ATR公司。IEEE信号处理学会语音技术委员会委员;IEEE语音与音频处理学报副主编; 1991年IEEE Arden House自动语音识别国际会议共同主席;香港中文大学客座教授,香港中文大学-微软亚洲研究院联合实验室共同主任。发表杂志/会议论文200多篇,拥有52项美国/国际授权/申请专利,指导了两篇ICASSP最佳学生论文。1993年成功转化的两项声控移动电话产品被Mobile Office Magazine评为年度最杰出产品,1997年因研发贝尔实验室自动语音识别软件系统获贝尔实验室总裁金奖。现为微软亚洲研究院首席研究员、语音组主任、IEEE Fellow。

参加此次讲座的还有本团队的王龙标教授,天津大学软件学院副院长魏建国教授以及到会进行学习的老师及同学共70余人。

8月14日上午九点半,本次语音处理学术讲座在王龙标教授的主持下正式开始。首先,王老师对本团队的语音课题组的学术研究情况做了简要的介绍,Frank Soong教授对此进行了点评并提出了诸多良好的意见和建议。接下来由解奉龙作了题为“A KL Divergence and DNN Approach to Voice Conversion without Parallel Training Data”的报告,主要介绍了一种在没有同步训练数据的情况下,基于KL散度和深度神经网络的语音转换方法。下午,Frank Soong教授为我们作了题为“Crossing Speaker and Language Barriers in Speech Processing——Applications to CALL and Audio/Visual TTS”的报告,主要介绍了如何跨越不同说话人和语言之间的障碍以及相关研究在语言学习与语音视频语音合成中的应用。报告结束后,各位老师和同学积极提问,解奉龙博士和Frank Soong教授都耐心地一一进行了解答。

图片1.png

8月15日上午,Frank Soong教授向我们介绍了由微软亚洲研究院发布的一款英语口语学习软件——“微软小英(mTutor)”,它根植于手机微信的公众号平台,可以帮助英语学习者完善发音,熟练口语,是计算机辅助语言学习(Computer Assisted Language Learning)领域一个成功的应用。通过这次报告,我们不仅熟悉了软件各种功能的使用,更了解了它背后应用到各种语音处理的知识,大家都感到获益匪浅。

此次语音学术讲座使团队的各位老师和同学对语音处理技术的专业知识及学术前沿动态有了更多的了解,同时,Frank Soong教授渊博的知识、严谨的治学态度,更深深影响了我们,使我们领悟到要想成为一名合格的语音技术研究者,不仅要有过硬的专业知识,对待学术的态度更要严密谨慎,精益求精,不能有一丝一毫的马虎。在这次交流访问中,双方就今后进行更进一步的合作交流达成一致。在今后的科研工作中,言语多模态交互及其认知计算团队会继续发扬这种严谨治学的学术精神,不断提高团队的学术水平。

扫码关注微信公众号

联系我们

地址:天津市津南区海河教育园区雅观路135号天津大学北洋园校区55教学楼,300350
邮箱:coic@tju.edu.cn

Copyright ©2017 天津大学智能与计算学部 版权所有