纪念天津大学计算机专业
成立60周年系列活动
“北洋智算论坛”第九讲
讲座时间
2018年11月19日(周一)
10:00
讲座地点
北洋园校区 55B204
主讲人
Hemant A. Patil
讲座题目:
语音生成感知链接:能量测量和非线性
讲座内容:
理解和建模言语产生现象是一项持续的努力。由于人类语音产生系统的空气动力学和由此产生的声学非线性以及复杂的解剖和几何结构,真实语音产生机制的建模仍然是一个非常困难和具有挑战性的开放性问题。因此,没有正式的理论来解释产生可理解的言语所涉及的所有结构。然而,我们仍然可以通过简化的模拟和离散信号处理模型来深入了解语音机制。该APSIPA DL的目的是进一步提高我们对这些具有挑战性(和开放性)的研究问题的理解,这些研究问题涉及语音生产的非线性方面的广泛领域,包括Teagers和Kaiser最初的研究、语音调制、Teager能量运算符(TEO)的开发,以及它最近扩展到可变长度版本(VTEO),用于语音幅度-频率解调的能量分离算法(ESA),以及它们的推广和扩展到高阶和多维。为了理解这些非线性理论,本讲座介绍了成功的语音技术应用,例如用于语音识别的高效特征提取和多带TEO/VETO的噪声抑制能力,使用哼唱的人物识别,用于双胞胎和重放攻击的说话人验证,情感识别,重音语音分析,正常与病理语音分类,声门闭合瞬间(GCI)估计,和突出的声学事件检测。
简介:
Hemant A. Patil:他于2006年7月在印度理工学院获得博士学位。自2007年以来,他一直在印度DI-ICT GANNHANGAR 担任教职,并在DA-IICT开发语音研究实验室,被认可为ISCA演讲实验室。 Patil博士是IEEE,IEEE信号处理协会,IEEE电路与系统学会,国际语音通信协会(ISCA),EURASIP和IEEE SLTC的会员。他是ICASSP和INTERSPEECH、Speech Communication、Elsevier、 Computer Speech and Language、 Elsevier and Int、 J. Speech Tech,Springer,Circuits,Systems and Signal Processing,Springer的常规评审员。他在国内和国际会议/期刊/书籍章节上发表了大约190种研究出版物。他作为短期学者访问了美国明尼苏达州明尼苏达大学(2009年5月至7月)的欧洲经委会部门。他曾与ASR,TTS和QbE-STD三个MeitY 赞助项目(作为PI)联系在一起。最近,他在2017年亚太信号与信息处理协会年度峰会暨会议(APSIPA ASC)和2018年INTERSPEECH期间与李海周教授共同提供了一个联合教程。他提供了与H. Kawahara教授关于“声音”的联合教程。转换:挑战和机遇,“在美国檀香山APSIPA ASC 2018期间。他被选为2018 -2019年的APSIPA杰出讲师(DL),他在三个国家拥有14个APSIPA DL。