Reinforcement Learning Based on Risk Measures
发布时间:2022年09月15日
浏览次数:3352
发布者: Xiaoni Tan
主讲人: Yijie Peng (Peking University)
活动时间: 从 2022-09-19 10:10 到 11:10
场地: Room 9, Quan Zhai, BICMR
基于风险度量的强化学习
经典的强化学习问题的目标是在动态环境下给出最优策略极大化累加期望回报。期望反映的是随机变量的平均值,它无法刻画随机变量的尾部分布,从而忽视了策略在极端环境下的表现。导致2008年全球金融危机的重要原因之一是对极端市场环境下的风险管理能力不足。本研究将提出以风险度量为目标函数的强化学习训练方法,使得最优策略在极端环境下表现的稳健性得到提升。