报告题目: 从生成式大模型到决策式大模型
主讲人: 张伟楠 上海交通大学计算机系长聘副教授
报告时间:2023年7月22日下午16:00
报告地点:厦门大学海韵园行政楼c505会议室
报告摘要:以gpt为代表的生成式大模型拥有强大的建模能力,尽管如此,它“漫无目的”生成的文本其实对用户并没有很大的帮助。相比之下,和人类指令对齐的chatgpt则能带给用户明显的好感,因为它带给了用户实在的价值。chatgpt人在环路的强化学习训练方法揭示了,“有目的性的”、带给用户实在价值的文本生成其实是一种决策任务。在本次报告中,我首先讨论基于无监督学习的生成式任务和基于强化学习的决策任务的相同和不同,摸清楚其边界。进而我将讨论生成式大模型的未来发展,即决策式大模型,介绍其相关的基础原理、两种基本范式和应用实践。
报告人简介: 张伟楠博士现任上海交通大学计算机系副教授、博士生导师,科研领域包括强化学习、信息检索和数据科学,相关的研究成果在国际会议和期刊上发表150余篇学术论文,谷歌学术引用1万余次,获得4个最佳论文奖项,出版教材《动手学强化学习》,相关成果被应用于华为鸿蒙系统,产生了显著的经济效益。张伟楠长期担任tpami、fcs等期刊的编委和neurips、ijcai、aaai等会议的领域主席。作为负责人承担国家自然科学基金项目和科技部重大项目课题,入选上海市科委英才扬帆计划、中国科协青年人才托举工程,获得吴文俊人工智能优秀青年奖和达摩院青橙奖。张伟楠于2011年在上海交通大学计算机系acm班获得学士学位,于2016年在伦敦大学学院计算机系获得博士学位。
邀请人:人工智能系苏劲松教授