管理科学系学术讲座(5月22日)

   间:2026年5月22日(周五) 9:30-10:30

地   点:管理学院思源楼524室

主 题:风险敏感的马氏决策过程与强化学习

主讲人:夏俐 中山大学管理学院教授

主持人:胡建强 复旦大学管理学院教授

摘要: 随着AlphaGo和大语言模型的成功应用,强化学习(RL)得到了学术界和工业界的日益重视,马氏决策过程(MDP)是强化学习的数学基础,两者本质都是研究随机动态系统的序贯决策问题。传统的MDP&RL的优化目标都是针对系统报酬这一随机变量的数学期望,而忽视了其高阶统计量乃至分布信息,如何优化该类目标将面临Bellman方程不成立、动态规划原理失效的难题,需要寻求新的方法论,该类优化目标也体现了MDP和RL问题的风险控制与安全因素,是学术界的前沿方向。本报告将主要汇报报告人近年来在该方向的系列研究结果,包括MDP的方差、CVaR、VaR、夏普率等优化目标的优化理论与方法。

报告人简介:夏俐,中山大学管理学院教授,长期从事马氏决策过程、强化学习、排队论、随机博弈等理论研究及其在能源、金融等领域的应用研究。在Automatica、IEEE Transactions on Automatic Control、Mathematics of Operations Research、Production and Operations Management等本领域顶级期刊发表论文20余篇,主持5项国家自然科学基金项目(1项重点)、3项国家重点研发计划子课题、多项华为&腾讯等企业研发项目。担任IEEE Transactions on Automation Science and Engineering、Discrete Event Dynamic Systems等国际权威SCI期刊的副主编(AE),曾两次获教育部高等学校自然科学二等奖,独立获得广东省哲学社会科学优秀成果奖等学术奖励。

 

 

报名咨询
姓名
不能为空
电话
不能为空
公司名称
不能为空
现任职务
不能为空
年收入
不能为空
报考意向
不能为空
感兴趣项目
不能为空
立即预约咨询
提交成功
请扫描二维码直接联系我们