内容推荐 本书是一本理论扎实,同时联系实际应用的图书。全书系统地介绍了因果推断的基本知识、基于机器学习的因果推断方法和基于因果推断的机器学习方法及其在一些重要领域的应用。 全书共分6章。第1章从潜结果框架和结构因果模型出发,介绍因果推断的基本概念和方法。第2章介绍近年统计和机器学习文献中出现的一些重要的基于机器学习的因果推断方法。第3章介绍能够提高机器学习模型的泛化能力的因果表征学习。第4章介绍因果机器学习如何提高机器学习模型的可解释性与公平性。第5章介绍因果机器学习在推荐系统和学习排序中的应用。第6章是对全书的一个总结和对未来的展望。 本书对结合因果推断和机器学习的理论与实践进行了介绍。通过阅读本书,读者不仅可以掌握因果机器学习的基础理论,还可对本书中提到的论文代码进行钻研,从而在实践中加深对因果机器学习的理解。 本书适合对因果推断和机器学习感兴趣的高校学生、教师阅读,也适合相关行业的工程师、数据科学家和研究员阅读。 作者简介 郭若城,英国伦敦字节跳动人工智能实验室机器学习研究员。研究重点为因果推断和可置信的机器学习在推荐系统、搜索排序和图数据中的应用。曾获美国亚利桑那州立大学杰出计算机科学博士生奖项。 目录 第1章 因果推断入门 1.1 定义因果关系的两种基本框架 1.1.1 结构因果模型 1.1.2 潜结果框架 1.2 因果识别和因果效应估测 1.2.1 工具变量 1.2.2 断点回归设计 1.2.3 前门准则 1.2.4 双重差分模型 1.2.5 合成控制 1.2.6 因果中介效应分析 1.2.7 部分识别、ATE的上下界和敏感度分析 第2章 用机器学习解决因果推断问题 2.1 基于集成学习的因果推断 2.2 基于神经网络的因果推断 2.2.1 反事实回归网络 2.2.2 因果效应变分自编码器 2.2.3 因果中介效应分析变分自编码器 2.2.4 针对线上评论多方面情感的多重因果效应估计 2.2.5 基于多模态代理变量的多方面情感效应估计 2.2.6 在网络数据中解决因果推断问题 第3章 因果表征学习与泛化能力 3.1 数据增强 3.1.1 利用众包技术的反事实数据增强 3.1.2 基于规则的反事实数据增强 3.1.3 基于模型的反事实数据增强 3.2 提高模型泛化能力的归纳偏置 3.2.1 使用不变预测的因果推理 3.2.2 独立机制原则 3.2.3 因果学习和反因果学习 3.2.4 半同胞回归 3.2.5 不变风险最小化 3.2.6 不变合理化 第4章 可解释性、公平性和因果机器学习 4.1 可解释性 4.1.1 可解释性的属性 4.1.2 基于相关性的可解释性模型 4.1.3 基于因果机器学习的可解释性模型 4.2 公平性 4.2.1 不公平机器学习的典型实例 4.2.2 机器学习不公平的原因 4.2.3 基于相关关系的公平性定义 4.2.4 因果推断对公平性研究的重要性 4.2.5 因果公平性定义 4.2.6 基于因果推断的公平机器学习 4.3 因果推断在可信和负责任人工智能的其他应用 第5章 特定领域的机器学习 5.1 推荐系统与因果机器学习 5.1.1 推荐系统简介 5.1.2 用因果推断修正推荐系统中的偏差 5.2 基于因果推断的学习排序 5.2.1 学习排序简介 5.2.2 用因果推断修正学习排序中的偏差 第6章 总结与展望 6.1 总结 6.2 展望 术语表\t 参考文献 序言 随着大数据时代的来临 ,机器学习技术突飞猛进, 并且在人类社会中扮演着越 来越重要的角色。例如,你 可能已经习惯了每天使用谷 歌、百度、必应等搜索引擎 查找信息,或者享受电商网 站和视频网站的推荐系统带 来的便利,以及利用谷歌、 百度等网站提供的机器翻译 学习外语,这些应用都离不 开机器学习模型的支持。但 机器学习模型,尤其是当下 流行的深度学习模型,面临 着域外泛化、可解释性、公 平性等挑战。例如,利用深 度学习模型做图像分类时可 能会根据图片中的沙漠背景 立刻判断图像中会出现骆驼 ,这是因为它不会意识到“ 沙漠背景”和“骆驼出现”之 间只存在相关性。也就是说 ,“沙漠背景”并不是“骆驼 出现”的原因。而认识到这 一点对人类来说并不难。因 此,为了实现通用人工智能 ,机器学习算法需要具备判 断特征和标签间是否存在因 果关系的能力。 另外,机器学习中对因 果关系的研究也一直扮演着 重要的角色。例如,在流行 病学中,孟德尔随机化揭示 了基因对患病概率的影响, 其本质是一种基于工具变量 的因果推断方法。在研究疫 苗的有效率时,双盲实验扮 演着不可替代的角色。这是 因为双盲实验可以衡量疫苗 对免疫力的因果效应。而近 几年出现了众多利用机器学 习方法解决因果推断问题的 研究。这是因为机器学习模 型不仅可以有效地处理复杂 的输入数据(如图像、文字 和网络数据),还能够学习 到原因和结果间复杂的非线 性关系。 如今,因果机器学习的 研究在学术界可谓百花齐放 ,从利用机器学习模型解决 因果推断问题到将因果关系 添加到机器学习模型中,都 会涉及因果机器学习。而在 业界,无论是像谷歌和BAT 这样的大公司、Zalando(总 部位于德国柏林的大型网络 电子商城,其主要产品是服 装和鞋类)这样的中型公司 ,还是像Causalens(一家英 国无代码因果AI产品开发商 )这样的创业公司,因果机 器学习都在解决业务问题中 扮演着重要的角色。这意味 着业界对因果机器学习人才 的需求也处于一个上升期。 例如,2022年的就业市场 对这类人才的需求就是一个 证明。但是,目前高校开设 的课程中很少有同时涉及因 果推断和机器学习的。这是 因为因果推断被认为是统计 学、经济学、流行病学的课 程。而机器学习主要出现在 计算机科学和数据科学的教 学大纲中。因此,希望本书 的出现可以帮助那些想要系 统学习因果机器学习,并在 将来从事相关工作的读者。 为了帮助读者建立连接 因果推断和机器学习这两个 重要领域所需要的知识体系 ,本书对内容做了精心规划 。为了照顾到没有因果推断 基础的读者,第1章解答了 在学习因果推断之初读者可 能面临的问题。例如,潜结 果框架和结构因果模型两种 基础理论框架到底有什么区 别?因果推断的经典方法有 哪些,它们分别适用于什么 场景?在此基础上,第2章 介绍了更前沿的、利用机器 学习模型来解决因果推断问 题的具有代表性的方法,希 望那些想要解决因果效应估 测、政策评估、智能营销增 益模型(uplift modeling)这 些因果推断问题的读者从中 有所收获。第3、4章中讨论 的域外泛化、可解释性和公 平性问题都在近几年受到学 界和业界的大量关注。它们 体现了基于相关性的机器学 习模型的局限性。而基于因 果性的因果机器学习方法对 于克服这些局限性十分有效 。这部分知识可以回答在机 器学习领域工作的读者的一 个问题:为什么因果性对于 机器学习的研究和实践非常 重要?第5章介绍基于因果 的推荐系统和学习排序方法 ,以帮助对这些领域感兴趣 的读者打下坚实的基础,并 在相关的科研和实践中做到 游刃有余。第6章是对全书 主要内容的总结。 我们基于在因果机器学 习研究、教学和实践中积累 的知识和经验撰写了这本《 因果推断与机器学习》,旨 在探索如何构建一个容易被 读者接受的因果机器学习知 识体系,为培养因果机器学 习的跨学科人才做一份贡献 。 由于作者的能力和精力 有限,本书难免会出现一些 纰漏,欢迎广大读者批评、 指正。希望每一位读者都能 在阅读本书的过程中有所收 获。无论读者是对因果推断 的基础知识进行了补充,还 是对因果机器学习的前沿方 向进行了了解,对我们来讲 都是莫大的荣幸。 本书在写作、校对和出 版的过程中,得到了国内外 众多专家学者和出版人员的 大力支持与帮助。在此,我 们对那些为本书做出贡献的 朋友表达诚挚的谢意。感谢 为本书撰写推荐语的多位专 家学者,他们是(排名不分 先后):吉林大学人工智能 学院院长常毅教授、美国弗 吉尼亚大学张爱东教授、美 国领英公司工程总监洪亮劫 博士。 感谢对本书的写作提供 巨大帮助的各位老师和同学 ,他们是(排名不分先后): 亚利桑那州立大学数据挖掘 与机器学习实验室(DMML) 全体成员、Meta AI人工智 能科学家张鹏川博士、微软 雷蒙德研究院资深首席研究 员:Emre Kiciman博士、弗 吉尼亚大学李骏东助理教授 和博士生马菁、加州理工学 院岳一松副教授、约 |