现代产业经济学系列讲座第212期

时   间:2021年12月1日(周三)13:30-15:00

地   点:复旦大学管理学院史带楼303室

题   目:Self-fulfilling Bandits: Dynamic Selection in Algorithmic Decision-making

主讲人:罗晔 香港大学经济与工商管理学院 副教授

主持人:李玲芳 复旦大学管理学院 教授

腾讯会议链接:https://meeting.tencent.com/dm/rspMqGVecLMi

会议号:189 720 504

会议密码:086309

摘要:This paper identifies and addresses dynamic selection problems that arise in online learning algorithms with endogenous data. In a contextual multi-armed bandit model,we show that a novel bias (self-fulfilling bias) arises because the endogeneity of the data influences the choices of decisions, affecting the distribution of future data to be collected and analyzed. We propose a class of algorithms to correct for the bias by incorporating instrumental variables into leading online learning algorithms. These algorithms lead to the true parameter values and meanwhile attain low (logarithmic-like) regret levels.We further prove a central limit theorem for statistical inference of the parameters of interest. To establish the theoretical properties, we develop a general technique that untangles the interdependence between data and actions.

主讲人简介:罗晔,2015年于美国麻省理工学院获得经济学博士学位,2010年同样于美国麻省理工学院获得数学与经济学学士学位。现任香港大学经济与工商管理学院终身副教授,加入香港大学之前曾于2015-2018在美国佛罗里达大学经济系任助理教授。罗晔博士的主要研究方向包括:高维计量经济学与统计学,机器学习理论与经济金融中的应用,如量化交易,风险管理等等。罗晔博士在不同国际杂志上发表/接受十余篇论文,包括Econometrica,Journal of the Royal Statistical Society: Series B, Journal of Machine Learning Research,等等。此外,罗晔博士有多项在大数据和人工智能算法方面与业界的实践与合作经验,包括滴滴出行,京东,顺丰,建设银行,华为,,Novartis, BMW, Alianz等等。

 

应用经济学系

2021-11-25