讲座主题:
文本情绪识别与原因抽取
主讲人姓名及介绍:
夏睿,南京理工大学计算机学院教授、博导,从事自然语言处理、文本数据挖掘方向的研究工作。在国内外重要期刊和会议发表论文40余篇、出版学术专著1部。以第一作者发表高水平论文20余篇,包括 CCF A类9篇、CCF B类4篇。论文总引用1200余次,一作论文引用1000余次。担任人工智能与自然语言处理领域多个国际顶级会议的领域主席、高级程序委员会委员。2014年入选南京理工大学紫金之星人才计划,2016年获得首届江苏省优青项目资助,2017年入选南京理工大学青年拔尖人才选聘计划并破格晋升为教授,2019年获得江苏省六大人才高峰项目资助,2019年获得第57届国际计算语言学会ACL杰出论文奖。
报告摘要:
近年来,文本中的情绪分析研究得到了越来越多的关注。当前,有两个主要的情绪分析任务:一是情绪识别,其目标是从人类心理学的角度预测文本中人们所表达的情绪(如喜怒哀乐);另一个是情感原因抽取,其目标是发现和抽取文本中某些情绪表达背后的潜在原因。学术界目前采用了包括基于规则的方法、传统的机器学习方法和深度神经网络在内的技术来解决这些任务。但是,大多数以前的工作都将该任务视为一组独立的子句级分类问题,而忽略了文档中多个子句之间的关系。为此,我们提出了两种方法:一种是位置增强嵌入和动态全局标签的有序子句预测模型,它将任务从独立的预测问题转换为重排序的子句预测问题;另一种基于RNN-Transformer层次网络进一步对文档中的多个子句进行同步编码和分类。我们还提出了一项新的任务:情绪原因对抽取,该任务旨在以成对的方式联合抽取文档中的情绪表达及其对应的原因。我们提出了一种两步策略来解决此任务,首先以多任务学习的方式独立进行情绪和原因的抽取,然后再进行情绪和原因的配对和过滤,最后在情绪原因抽取基准语料库上的实验证明了任务的可行性和方法的有效性。