ICML:当因果遇见机器学习
某机构首席科学家Dominik Janzing在今年的国际机器学习会议(ICML)上共同发表了4篇论文,这些论文均聚焦因果关系研究。其2012年与某机构副总裁Bernhard Schölkopf合作的论文《论因果与反因果学习》获得ICML时间检验奖荣誉提名。
Janzing指出:"虽然涉及因果关系的论文仍占较小比例,但长期趋势明显增长。预测显示因果关系将在机器学习中扮演更重要的角色。"
因果研究的跨领域起源
传统因果问题关注特定干预的因果效应,例如药物对患者康复的影响。而图模型社区则致力于建模复杂系统,通过多变量图模型计算变量间的平均效应,并将系统分解为可理解机制。因果发现——从被动观察中推断图模型——仍是极具挑战性的目标。
机器学习与因果的结合
2010年左右,研究者逐渐认识到因果关系对多种机器学习问题的重要性,特别是在区分统计关系推断与生成过程推断方面。当前热点包括:
- 可解释AI是否必然需要因果解释
- 语义表示是否必须是因果表示
- 学习对分布变化具有鲁棒性的数据表示
因果定义的挑战
Janzing强调因果概念常依赖于上下文环境,特别是在宏观经济学等强聚合领域。虽然"所有模型都是错的,但有些是有用的"这一格言广为人知,但在因果模型讨论中尚未得到充分重视。
技术实现与方法论
在ICML发表的论文《基于因果结构的异常根因分析》中,研究团队:
- 首次形式化定义了极端事件的根因
- 将因果图中的噪声变量视为可切换的"开关"机制
- 提出量化不同根因对结果贡献程度的方法
数学工具的多源性
因果机器学习研究涉及多种数学工具:
- 统计学与函数分析(特别是核方法)
- 线性代数与香农信息论
- 算法信息论与傅里叶分析
- 群论与博弈论
Janzing认为:"目前无法预测10年后因果推断将主要使用哪些数学方法,这个领域仍然非常开放,远未局限于特定主题或方法。"
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码