编辑 | 紫罗
过去几年,通过在大量不同的数据集上训练通用模型,视觉和自然语言处理 (NLP) 机器学习领域取得了重大进展。这导致了「基础模型」的出现。
例如,「大型语言模型」引发了 NLP 的复兴:微调或提示通才模型现在已成为标准做法,而不是从头开始训练专业模型。
然而,机器学习在科学数据集上的应用尚未发生类似的范式转变。
这就是「Polymathic AI」(博学人工智能)研究计划寻求解决的一个未实现的机会。
图灵奖得主、Meta 首席科学家 Yann LeCun 表示:「很高兴成为 AI for Science 新计划(Polymathic AI)的顾问」。
剑桥大学 AI+天文/物理助理教授 Miles Cranmer 在 twitter 也分享了其参与的一项新计划:Polymathic AI!
「我们正在开发科学[数据]的基础模型,以便它们可以利用跨学科的共享概念。」
网友纷纷表示:「这太酷了!这看起来很有趣!惊人的研究……」
Polymathic AI 计划的目标是加速开发针对数值数据集和科学机器学习任务定制的多功能基础模型。
面临的挑战是建立人工智能模型,利用来自异构数据集和不同科学领域的信息,与自然语言处理等领域相反,这些模型不共享统一的表示(即文本)。
然后,这些模型可以用作强大的基线,或者由科学家针对特定应用进行进一步微调。这种方法有可能通过提供现成的模型来实现科学中人工智能的民主化,这些模型对于共享的一般概念(如因果关系、测量、信号处理,甚至更专业的共享概念(如波))具有更强的先验(即背景知识)。否则这些概念需要从头开始学习。
为了实现这一目标,该研究计划汇集了一支由纯机器学习研究人员和领域科学家组成的团队,涵盖各个学科。此外,还接受由世界领先专家组成的科学咨询小组的指导。
研究团队。
科学咨询小组。
参与机构。
建立真正的科学基础模型需要大量的初步研究。研究计划正集中精力研究这个领域的基础知识,迄今为止已经发表了关于关键架构组件的研究,从适应数值数据的语言模型到展示在不同物理系统上训练的代理模型的可转移性,再到学习多模态科学数据的共享嵌入。
该研究计划对这个研究方向重新定义科学机器学习前景的潜力感到兴奋,而 Polymathic AI 代表了实现这一目标的雄心勃勃的一步。
项目开源地址:https://github.com/PolymathicAI/
参考内容:https://polymathic-ai.org/blog/announcement/
https://polymathic-ai.org/
https://twitter.com/MilesCranmer/status/1711429121220465037