2020年7月20日至25日,第六届新葡的京集团3522vip研究生暑期学校——“机器学习及数据驱动的决策管理国际暑期学校”(ZJU-NUS International Summer School 2020 for Machine Learning and Data-driven Decision Management)通过ZOOM会议平台成功举办。
此次暑期学校由新葡的京集团3522vip新葡的京集团3522vip、新葡的京集团3522vip数据分析和管理国际研究中心、浙大管院数据科学与管理工程学系、新加坡国立大学联合主办,一共邀请了7位来自新加坡国立大学和新葡的京集团3522vip新葡的京集团3522vip的优秀学者,深入探讨和慷慨分享相关领域的学术问题。
浙大管院副院长、浙大数据分析和管理国际研究中心主任周伟华教授在欢迎致辞中表达了对此次ZJU和NUS两校强强联合暑期学校的希冀,在总结中盼望双方未来国际合作的顺利开展。浙大管院金庆伟副教授、彭希羡研究员和王明征教授在六天中轮流担任主持人。
1 Distributionally Robust Optimization
来自NUS的教授SIM Melvyn以分布鲁棒性优化为主题,为同学们带来了两场精彩的报告。在第一讲中,Sim教授从不确定性以及风险偏好的概念出发,引入模糊集与鲁棒性优化的概念。结合运筹学中经典的报童模型,并假设仅能获得关于需求的部分信息可以得到新的鲁棒性报童问题模型。通过对包含需求信息的模糊集不同方式的刻画,Sim教授由易至难分别介绍了已知需求的支撑集、已知离散需求的矩信息、已知连续需求的分段凸矩信息、已知连续需求的凸矩信息这四种情况,并给出了相应的求解方法,为同学们深入学习分布鲁棒性优化打下了基础。在第二讲中,Sim教授主要展示了他所在团队的一项工作,利用分布鲁棒性优化模型求解两阶段生产-定价问题,以及他们所开发的求解鲁棒性随机优化的工具箱RSOME。他还建议想深入学习鲁棒性优化的同学,可以先从经典教材Convex Optimization开始学起,并且可以尝试使用RSOME来解决一些问题。在讲座中,Sim教授的细心幽默讲解与精辟回答给大家留下了深刻印象。
2 Natural Language Understanding: Syntactic and Semantic Analyses
来自NUS的助理教授QIAO Dandan以自然语言处理中的句法与语义分析为主题,为同学们带来了一场从语法到语义,从词汇到语句的精彩报告。她首先简明扼要地提出了自然语言处理的目的:机器与人的沟通和交流。由于人类语言存在诸如:内容、词汇、语法的模糊性和多义性等特征,使自然语言处理成为一项极具挑战的任务。因此,她首先详细阐述了语义解析方法:上下文无关语法(Context-Free Grammars)。随后,她向同学们介绍了选区分析(Constituency Parsing)、自顶向下分析(Top Down Parsing)、自底向上分析(Bottom Up Parsing)、统计句法分析(Statistical Parsing)、概率上下文无关语法分析(Probabilistic Context Free Grammar)等多种句法分析方法。在第二部分,她向同学们介绍了词汇语义学(Lexical Semantics)、向量语义学(Vector Semantics)、词汇转向量(Word2vec)等多种语义分析方法。讲座最后还涉及在自然语言处理中,如何清晰地向人表达语句的意思。她系统且细心的讲解,获得了一致认可。
3 Smart Urban Transport and Logistics
来自NUS的助理教授HE Long以智慧城市运输与物流为题,给大家带来了一整天的精彩讲座。HE Long教授首先简要概括了OM/OR领域中智慧城市运输与物流方面的研究方向与进展:主要包括技术创新、商业模式创新、最后一公里配送、仓库运营、医疗调度、需求估计等。在许多研究中,数据驱动方法起到了非常关键的作用。在对提出问题与分析问题的思路进行阐述后,他重点介绍了两项完成的研究工作:出租车运营中的派车问题与最后一公里的外卖派单问题。对于问题1,他采用结合预测与优化的方法,通过回归树寻找协变量和其与用车需求在不同情境下的关系,以获得更加精细化的模糊集,再建立并求解分布鲁棒性优化模型,得出相应的派单策略;对于问题2,他采用了类似的研究框架,利用历史数据学习司机的派单时间,结合服务时间的随机变量建立了分布鲁棒性优化模型并加以求解。HE Long教授“上午讲背景,下午谈方法”的报告策略给大家留出了充分的思考时间,获得了参会师生的一致好评。
4 Data Driven Platform Economics and Management
新葡的京集团3522vip“百人计划”研究员曹仔科在报告中指出平台业务模式和大数据是当下的两个明显趋势。两个趋势的交互影响,即在大数据背景下,值得深入研究平台应该如何制定策略。他从三个角度分享了大数据和平台策略的交叉研究:1. 商家广告与促销:价格折扣对团购的影响、根据购物车制定销售策略的有效性、社交媒体网红营销的信息披露方式等;2.平台治理:对商家直接管制和给商家贴上信誉标签,平台拥有者是否该进入市场等;3. 用户隐私和算法透明度:隐私控制和个性化广告等。最后,他鼓励参会者从审稿人的角度写一篇文献的批语,以此寻找文献空缺和新的研究方向,这在很大程度上启发了信息系统研究领域的同学。
5 Topics in Dynamic Pricing
商品的价格往往会受到供给与需求(如季节性,参考价格)等原因而不断波动,来自NUS的助理教授HU Zhenyu在报告中分别给出了动态定价在参考价格效应(reference price effect)与消费者搜索(consumer searching)两种影响因素下的模型,解释了为什么会产生价格波动,以及在了解消费者行为后应如何帮助商家获得最优的定价策略。在不同的价格敏感性下,需求函数也会有所不同。他提出可以通过分段线性函数将利润函数简化,并展示了在不同敏感度情况下的定价策略:在降价敏感的情况下,收益函数为凹函数,从长远来看应该不采取任何调价措施;而在升价敏感的情况下,会大大增加问题的复杂度,此时拥有周期性促销性质的循环递减价格策略(cyclic skimming pricing strategy)是最优定价方案。另外,商家在有限时间进行促销会影响消费者的搜索行为,当搜索对于消费者的意义不大时,商家应给予短暂有力的优惠;而当搜索对于消费者的意义较大时,商家应长时间促销,当同质商品促销程度较大时,价格战对于商家而言并不是一个好的策略,应当控制折扣力度,延长促销时间。
6 Panel Data Analysis with Causal Inference
来自NUS的助理教授CHEN Nan为大家介绍了计量经济学中的经典模型,主要讨论了利用线性面板数据模型进行因果推断。Chen Nan教授首先从经典的线性模型、最小二乘估计及其基本假设引入,讲述了经典假设在实际建模过程中的不足,并介绍了固定效应模型、随机效应模型两种模型,包括其模型形式、基本假设、参数估计方法、模型检验方法等。同时讨论了两种模型的对比,从两种模型各自的特点出发指导在实际问题建模时如何选择模型。另外,他讲解了面板数据外生性假设,如同期外生性假设等,以及面板数据建模中遇到的问题,如双向效应、不平衡面板、如何根据应用领域处理这些问题等。
7 Revenue Management under Discrete Choice Model
新葡的京集团3522vip新葡的京集团3522vip副教授金庆伟介绍了几种类型的离散选择模型,分别是:Locational Choice Model、Multinomial Logit Model (MNL)、Markov Chain Model以及Random Utility Model (RUM),其中MNL模型是Markov Chain Model的特殊情况,Markov Chain Model和Locational Choice Model是RUM模型的特殊情况。随后,他介绍了这些模型和Binary Choice Forest之间的联系。他举例说明MNL模型和Markov Chain Model在组合优化问题方面的具体应用,以及MNL模型在共同优化定价和产品组合问题时的应用,比较了MNL模型和机器学习算法在产品推荐方面的表现。结果表明,虽然MNL模型在预测精度方面的表现不如机器学习算法,但是它带来的期望收益远高于机器学习算法;最后他阐述了当有参考效应存在时,如何进行定价和组合优化问题。
在最后一天的座谈环节里,授课老师们集体在线为同学们答疑解惑。其中关注最多的问题是如何选择自己的研究方向。老师们说,研究方向的选择不是一蹴而就的,既要结合自己的兴趣,更要广泛地阅读文献,前期试错在所难免,但是不要害怕犯错,期待未来有更多的学术新星冉冉升起。
此次暑期学校采取线上授课方式,报名人数和一周参会总人次均过一千,参会者连续一周一起享受学术盛宴。借助优质的沟通平台,大家对机器学习、运筹优化、供应链、收益管理等方面的具体问题有了进一步了解,很多参会者把握机会与讲座嘉宾进行深度交流。授课老师们也纷纷期待未来深入合作项目与联合培养学生的机会。