基于融合机器学习和因果推断方法的因果学习已逐渐成为研究领域和业界应用的一个热点区域。
在这个方向,我们希望有类似sklearn之于机器学习那样好用的工具包,可以帮助我们简单的应用各个模型。
本周日上午9点,
读书会
邀请到CausalML创始团队的赵振宇,为我们介绍CausalML作为一个基于Python的开源项目的发展历程,核心方法,以及应用场景。
由智源社区、集智俱乐部联合举办的
因果科学与Causal AI读书会第三季
,其目标是:将主要结合因果推断的潜在结果(Potential Outcomes)框架展开讨论,并尝试在不同领域,包括但不限于医学、经济学、机器学习等领域,尝试建立与SCM的对应关系。读书自2021年10月24日开始,每周日上午 09:00-11:00举办,持续时间预计 2-3 个月。
因果学习(causal learning)是一个融合了因果推断和机器学习的领域,包含很多方法,其中uplift模型是一个重要方法,在业界有着丰富的应用场景。早在2018年,Uber的数据科学团队面临需要uplift模型解决的问题,在没有找到合适的开源工具包的情况下,开发了CausalML,随后作为开源项目提供给更广泛的社区使用,也吸引来更多的开发者完善了这个工具包。目前,CausalML已有超过60万的下载量,开源项目组也在持续维护和升级这个工具包。
CausalML最初是为了解决什么问题而建设的?其中包含哪些方法?可以应用于哪些场景?希望通过这次分享,让大家了解到更多的关于CausalML的信息和用法。
赵振宇
,腾讯数据科学总监。先后在Yahoo,Uber,腾讯任职。负责实验、因果推断、机器学习、产品分析、平台建设、开源软件、应用研究方面的工作。CausalML发起者之一,《关键迭代可信赖的线上对照实验》译者之一。
https://github.com/uber/causalml
[1] Ahmed Alaa and Mihaela Schaar. Limits of estimating heterogeneous treatment effects: guidelines for practical algorithm design. In International Conference on Machine Learning, 129–138. 2018.
[2] Susan Athey and Guido Imbens. Recursive partitioning for heterogeneous causal effects. Proceedings of the National Academy of Sciences, 113(27):7353–7360, 2016.
[3] Susan Athey, Julie Tibshirani, Stefan Wager, and others. Generalized random forests. The Annals of Statistics, 47(2):1148–1178, 2019.
[4] Susan Athey and Stefan Wager. Efficient policy learning. arXiv preprint arXiv:1702.02896, 2017.
[5] Pierre Gutierrez and Jean-Yves Gerardy. Causal inference and uplift modeling a review of the literature. JMLR: Workshop and Conference Proceedings 67, 2016.
[6] Jason Hartford, Greg Lewis, Kevin Leyton-Brown, and Matt Taddy. Deep iv: a flexible approach for counterfactual prediction. In Proceedings of the 34th International Conference on Machine Learning-Volume 70, 1414–1423. JMLR. org, 2017.
[7] Guido W Imbens and Jeffrey M Wooldridge. Recent developments in the econometrics of program evaluation. Journal of economic literature, 47(1):5–86, 2009.
[8] Sören R Künzel, Jasjeet S Sekhon, Peter J Bickel, and Bin Yu. Metalearners for estimating heterogeneous treatment effects using machine learning. Proceedings of the National Academy of Sciences, 116(10):4156–4165, 2019.
[9] Xinkun Nie and Stefan Wager. Quasi-oracle estimation of heterogeneous treatment effects. arXiv preprint arXiv:1712.04912, 2017.
[10] Miruna Oprescu, Vasilis Syrgkanis, and Zhiwei Steven Wu. Orthogonal random forest for heterogeneous treatment effect estimation. CoRR, 2018. URL: http://arxiv.org/abs/1806.03467, arXiv:1806.03467.
[11] Piotr Rzepakowski and Szymon Jaroszewicz. Decision trees for uplift modeling with single and multiple treatments. Knowl. Inf. Syst., 32(2):303–327, August 2012.
[12] Yan Zhao, Xiao Fang, and David Simchi-Levi. Uplift modeling with multiple treatments and general response types. In Proceedings of the 2017 SIAM International Conference on Data Mining, 588–596. SIAM, 2017. https://arxiv.org/abs/1705.08492
[13] Hahn, P. Richard, Jared S. Murray, and Carlos M. Carvalho. “Bayesian Regression Tree Models for Causal Inference: Regularization.” Confounding, and Heterogeneous Effects 1706 (2017).
[14] Chen, Huigang, Totte Harinen, Jeong-Yoon Lee, Mike Yung, and Zhenyu Zhao. “Causalml: Python package for causal machine learning.” arXiv preprint arXiv:2002.11631 (2020). https://arxiv.org/abs/2002.11631
[15] Zhao, Zhenyu, Yumin Zhang, Totte Harinen, and Mike Yung. “Feature Selection Methods for Uplift Modeling.” arXiv preprint arXiv:2005.03447 (2020).
[16] Zhao, Zhenyu, and Totte Harinen. “Uplift modeling for multiple treatments with cost optimization.” In 2019 IEEE International Conference on Data Science and Advanced Analytics (DSAA), pp. 422-431. IEEE, 2019.
由智源社区、集智俱乐部联合举办的
因果科学与Causal AI读书会第三季
,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。读书自2021年10月24日开始,每周日上午 9:00-11:00举办,持续时间预计 2-3 个月。
读书会大纲一览:
Donald Rubin:Essential Concepts of causal inference
因果推断在观察性研究中的应用(续):ANALYSIS
因果与公平性和可解释性
「深入理论学习」