学术交流

首页 / 学术交流 / 学术讲座 /

学术交流

“统计大讲堂”第206讲回顾: 基于因果无害的策略学习方法

2023-03-05

2月22日上午,“统计大讲堂”系列讲座第206讲举行。本次讲座采取线上会议的方式,邀请中国人民大学统计学院讲师刘越作题为“基于因果无害的策略学习方法”的报告。讲座由中国人民大学统计学院讲师吴奔主持。

吴奔首先介绍了主讲人的相关信息。刘越是中国人民大学统计学院讲师,2019年在北京大学数学科学学院取得博士学位,多篇文章发表在Journal of Machine Learning,Artificial Intelligence,IEEE Transactions on Knowledge and Data Engineering,Uncertainty in Artificial Intelligence等期刊与会议中。研究兴趣主要包括因果推断,概率图模型以及可信机器学习。

首先刘越指出,随着越来越多的机器学习算法用于推理和决策,学界和业界的研究者越来越关注可信机器学习,如机器学习的安全性、鲁棒性、可解释性、公平性等,并且提出本次大讲堂主要聚焦于讨论机器学习的“无害性”,以及基于“无害性”的策略学习方法。

接着,他通过经典电车悖论、希波克拉底誓言和阿西莫夫机器人第一定律指明政策制定要考虑到个体,尽可能做到无害。然后他介绍了一些该领域的预备知识,如SUTVA假定、强可忽略性假定、个体因果作用和条件因果作用等。根据潜在结果我们可以把人分为四类,但是由于因果推断的本质问题,我们无法从观测数据中识别这四类人。

随后,他提出了无害性准则并讨论了两个常见的场景:uplift模型、WMM模型和推荐系统的推荐算法是否满足无害性原则。

紧接着,他又提出了反事实无害准则,并引入指标FNA及其上界,进一步讨论无害策略学习,也即我们希望在FNA小于固定阈值的前提下,找到收益最大的策略。最后他从估计和优化两个角度,讨论算法背后的理论性质,并展示了在JOBS和IHDP的数据上做的实验结果。

在提问环节中,刘越认真细致地解答了师生们的疑问,就本话题进行了更进一步的探讨。