德克萨斯大学奥斯汀分校高睿助理教授做客“SEM管理科学”青年学者论坛

首页 - 学术活动

德克萨斯大学奥斯汀分校高睿助理教授做客“SEM管理科学”青年学者论坛

2023年03月11日作者：文/赵嘉图/冯芳（经济与管理学院）来源：韩明瑞

　　3月8日，经管学院“SEM管理科学”青年学者论坛邀请到德克萨斯大学奥斯汀分校高睿助理教授带来题为“Optimal Robust Policy for Feature-Based Newsvendor”的学术报告。高睿的研究领域主要为不确定性下的数据驱动决策和数据指示性分析，其目前担任数学优化领域顶级期刊Mathematical Programming副编辑，研究成果曾获Winner in Junior Faculty Interest Group Paper Competition等在内的多项奖励。

　　讲座中，高睿首先介绍了经典的报童模型及其最优解。通常情况下，在做出决策之前决策者可以观测到大量与产品需求相关的特征——时间、空间、社会或经济信息，这些特征有助于降低需求的不确定性，可以帮助决策者根据每个特征的实现定制订货决策。因此，在订货决策中特征信息是非常必要的。在本研究中，高睿关注于策略优化，即找到一组端到端的，从特征映射到订货决策的策略以最小化所有特征值下的期望成本。大多数现有的工作将策略限制在某种参数类上，可能存在次最优性（如仿射类）或缺乏可解释性（如神经网络）。不同的是，该研究考虑的是整个策略空间。在这种设定下，经典的经验风险最小化只能得到退化策略，其在未观测的特征值上无定义。

　　为了解决上述问题，通过构造以特征-需求经验分布为中心的type-1 Wasserstein分布不确定集，高睿考虑了一种分布式鲁棒策略优化框架。该框架可以有效对抗特征和需求的不确定性并解决经验分布下策略优化的退化问题。在计算层面，这类框架属于可调整鲁棒优化（Adjustable robust optimization）的范畴且需要基于无穷维的策略空间进行优化，所以通常难以求解。除了某些特殊情况外，这类问题的最优解通常是未知的。然而，高睿证明了其提出的分布式鲁棒策略优化框架可以通过两步被高效精确求解：首先计算样本内（In-sample）鲁棒问题得到样本内特征下的策略，然后通过一种称之夏普列扩展（Shapley extension）的插值方法将样本内策略外推至其他未观测到的特征，得到的策略是最优的。进一步分析报童模型的结构，原问题可以被等价表述为一个被李普希兹（Lipschitz）项正则化的经验策略优化问题，这使得样本内鲁棒问题可以被表示为一个容易求解的线性规划问题。基于生成数据和真实数据的一系列实验结果表明得到的最优策略可以同时兼顾鲁棒性和计算效率，其样本外成本要优于其他现有的方法。报告的最后，高睿指出，该最优策略可以扩展到其他具有类似成本函数的问题。

　　报告结束后，在场师生就模型构建、理论结果及实验设计等内容同高睿助理教授进行了热烈的讨论和交流。

责编：韩明瑞

德克萨斯大学奥斯汀分校高睿助理教授做客“SEM管理科学”青年学者论坛

最新动态

专题热点