某研究机构在ICML 2023的最新研究成果
会议背景
第40届国际机器学习会议(ICML 2023)于7月23-29日在夏威夷檀香山举行。该会议汇聚人工智能社区分享新想法、工具和数据集,推动领域发展。从计算机视觉到机器人技术,全球研究人员将展示最新进展。
科学、技术与社会部门负责人将发表关于具有社会目的的机器学习的演讲,应对医疗保健和气候挑战,采用社会技术视角并加强全球社区。
研究成果概览
研究人员在本届ICML会议上展示了80余篇新论文。由于许多论文是在某研究中心与某研究团队合并前提交的,最初以某研究团队名义提交的论文将包含在某研究博客中,而本博客重点介绍以某研究机构名义提交的论文。
模拟世界中的AI技术
能够阅读、写作和创造的人工智能的成功建立在基础模型之上——这些AI系统通过海量数据集训练,能够学习执行多种任务。最新研究探索如何将这些成果转化为现实世界应用,为更具通用能力和具身化的AI代理奠定基础,使其更好地理解世界动态,为更有用的AI工具开辟新可能性。
在口头报告中,介绍了AdA——一种能够在模拟环境中适应解决新问题的AI代理,类似于人类行为。在几分钟内,AdA可以完成具有挑战性的任务:以新颖方式组合物体、导航未知地形以及与其他玩家协作。
同样展示了如何使用视觉语言模型帮助训练具身代理——例如通过告诉机器人它在做什么。
强化学习的未来发展
为了开发负责任和可信赖的AI,必须理解这些系统的核心目标。在强化学习中,这可以通过奖励来定义。
在口头报告中,旨在解决Richard Sutton首次提出的奖励假设,该假设认为所有目标都可以被视为最大化预期累积奖励。解释了该假设成立的确切条件,并阐明了在强化学习问题的一般形式中,哪些目标可以——哪些不能——通过奖励来捕获。
在部署AI系统时,它们需要足够健壮以应对现实世界。研究了如何在约束条件下更好地训练强化学习算法,因为AI工具通常需要出于安全和效率考虑而受到限制。
在获得ICML 2023杰出论文奖的研究中,探索了如何在具有不完美信息的不确定性环境下教授模型复杂的长期策略。分享了模型如何在不知道其他玩家位置和可能移动的情况下赢得双人游戏。
AI前沿挑战
人类能够轻松学习、适应和理解周围世界。开发能够以类人方式泛化的先进AI系统,将有助于创建可用于日常生活和应对新挑战的AI工具。
AI适应的一种方式是快速根据新信息改变其预测。在口头报告中,研究了神经网络的可塑性及其在训练过程中如何丢失——以及防止丢失的方法。
还提出了可能有助于解释大型语言模型中出现的上下文学习类型的研究,通过研究在统计量自发变化的数据源上元训练的神经网络,例如自然语言预测。
在口头报告中,引入了一个新的循环神经网络(RNN)家族,这些网络在长期推理任务上表现更好,以释放这些模型未来的潜力。
最后,在"分位数信用分配"中提出了一种将运气与技能分离的方法。通过建立行动、结果和外部因素之间更清晰的关系,AI可以更好地理解复杂的现实世界环境。
技术展示内容
在会议上还展示了关于蛋白质结构预测、聚变科学进展以及新模型的演示,包括用于机器人的PaLM-E和用于从文本生成视频的Phenaki模型。
相关技术资源:查看完整ICML 2023日程安排
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码