讲座题目:
大规模智能体强化学习:基础建设搭建和前沿算法落地
讲座内容:
近年来,机器学习的落地场景有两个发展方向,一是从预测到决策的范式拓展,另一个则是从单智能体到多智能体的场景推广。由此,面向多智能体系统的深度强化学习开始越来越受到学术界和工业界的关注。本次报告,我将从多智能体深度强化学习的几个落地任务切入,由此引入它的基本数学定义和几个经典解决方法。之后我将深入海量智能体场景下的不同场景,探讨在海量智能体的情况下,传统多智能体强化学习方法的不足,并深入介绍基于平均场理论的强化学习和基于因子分解模型的强化学习算法。
最后,介绍MAgent和CityFlow,两个专为海量智能体场景提供模拟实验的平台,并展示上述算法在该平台上的初步实验效果和业界落地情况。
主讲人介绍:
张伟楠博士现任上海交通大学约翰·霍普克罗夫特研究中心助理教授,科研领域包括深度学习、强化学习、数据挖掘、知识图谱及其在推荐系统、搜索引擎、文本分析等场景中的应用。相关的研究成果在国际一流会议和期刊上发表70余篇学术论文。2016年获得由微软研究院评选的“全球SIGKDD Top 20科研新星”称号;2017年获得ACM国际信息检索会议SIGIR的最佳论文提名奖;2017年获得上海ACM新星奖;2018年获得阿里巴巴达摩院青橙奖。他曾在KDD-Cup用户个性化推荐大赛获得全球季军,在全球大数据实时竞价展示广告出价算法大赛获得最终冠军。