Reinforcement Learning Based on Risk Measures

Time: 2022-09-15 Published By: Xiaoni Tan

Speaker(s): Yijie Peng (Peking University)

Time: 10:10-11:10 September 19, 2022

Venue: Room 9, Quan Zhai, BICMR

基于风险度量的强化学习

经典的强化学习问题的目标是在动态环境下给出最优策略极大化累加期望回报。期望反映的是随机变量的平均值，它无法刻画随机变量的尾部分布，从而忽视了策略在极端环境下的表现。导致2008年全球金融危机的重要原因之一是对极端市场环境下的风险管理能力不足。本研究将提出以风险度量为目标函数的强化学习训练方法，使得最优策略在极端环境下表现的稳健性得到提升。