报告题目:基于知识迁移的深度强化学习方法及应用
主讲人: 章宗长,南京大学人工智能学院副教授、博导
报告时间:2022年08月12日(星期五)10:00-12:00
报告地点:#腾讯会议858-598-812
报告摘要:
在本次报告中,我将先简要介绍我们近期在基于知识迁移的深度强化学习方法方面做的三个工作。第一个工作是使用序列结构的跨模态领域自适应方法,其特点是利用由强化学习任务采样得到的数据间的序列结构,缓解跨模态带来的不一致性。该方法可以跨过图像渲染这种模态,直接把从没有图像渲染的仿真器中学到的策略配置在真实环境中。第二个工作是环境敏感的上下文策略学习算法,其特点是通过优化上下文编码器,快速识别并适应突发变化。该方法可以克服现有方法需要与变化的环境交互多次来识别变化的缺陷,能在突然变化的环境中快速调整策略,以适应新环境。第三个工作是基于分布式队友建模的多智能体激励式通信方法,其特点是通过分布式队友建模,有选择地向队友发送消息,通过发送的消息来修正队友的值函数,并通过正则化通信权重实现了定制化的高效稀疏通信。最后,我将简要介绍我们组在迁移深度强化学习落地应用方面做的一些尝试。
报告人简介:
章宗长,南京大学人工智能学院副教授、博导。现为计算机软件新技术国家重点实验室成员,机器学习与数据挖掘研究所(lamda)成员,中国计算机学会(ccf)高级会员,ccf人工智能与模式识别专委会委员,中国人工智能学会机器学习专委会通讯委员。2012年于中国科学技术大学获得博士学位,曾在苏州大学工作5年,并先后在罗格斯大学、新加坡国立大学、斯坦福大学等开展研究工作。研究方向为强化学习、智能规划和多智能体系统。已在国际会议(aaai、icml、ijcai、neurips等)和国内外期刊(jaamas、jcst等)发表论文50余篇,获授权的国家发明专利15项。共同发起了亚洲强化学习系列研讨会。担任science合作期刊《intelligent computing》编委会委员,sci期刊《frontiers of computer science》的青年编委,aaai、ijcai、ecai、icaps等ccf a/b类会议的高级程序委员。近年来主持国家自然科学基金2项,与阿里巴巴、海康威视、南栖仙策、华为、网易等企业有多种形式的科研合作。入选南京大学第二批“紫金学者”(2021)。
邀请人:计算机科学与技术系 林琛教授