2019—2023 年《Nature Machine Intelligence》封面
编辑 | X
五年前(2019 年 1 月),《Nature Machine Intelligence》创刊。当然,就人工智能(AI)而言,五年前似乎是一个不同的时代。
1 月 24 日,Nature Machine Intelligence 杂志在《Anniversary AI reflections》(周年人工智能反思)专题中,再次联系并采访了近期在期刊发表评论和观点文章的作者,请他们从各自所在领域中举例说明人工智能如何改变科学过程。
想知道,他们对人工智能领域的哪些其他主题感到兴奋、惊讶或担忧,以及他们对 2024 年以及未来五年的人工智能的希望和期望是什么。一个反复出现的主题是大型语言模型和生成人工智能的持续发展、它们对科学过程的变革性影响以及对伦理影响的担忧。
引人注目的是,这些作者强调了人工智能如何彻底改变了各个学科;例如,正如西班牙赫罗纳大学(University of Girona)Noelia Ferruz 提到的,蛋白质设计和工程领域。但他们也讨论了 LLM 的最新发展,例如 ChatGPT 和生成人工智能,如何改变了整个研究工作流程,包括科学写作过程、编码和头脑风暴。
此外,他们预测,鉴于 LLM 和生成式人工智能的持续发展,未来五年将带来进一步的实质性变化,例如连接到物理世界的个性化模型和人工智能代理框架。正如有作者强调的那样,这些变化无疑会带来进一步的道德挑战。
赫罗纳大学 Noelia Ferruz:专注于 AI 蛋白设计
你的观点是关于什么的?
我们的文章回顾了大语言模型(LLM)在蛋白质研究领域的应用,特别关注 Transformer 架构及其各种训练技术。我们密切关注生成 LLM 在蛋白质设计中的实施和使用,并讨论了它们在未来几年的潜力。
论文链接:https://www.nature.com/articles/s42256-022-00499-z
该领域是如何发展的?
人工智能正在快速发展,在过去的一年里我们见证了令人难以置信的进步。扩散模型在生成图像方面取得了前所未有的成功,2022 年末,OpenAI 发布了 ChatGPT,展示了在文本生成方面的卓越性能。
这些进步也影响了蛋白质设计领域,近几个月发布了几种蛋白质扩散模型,促进了对传统上具有挑战性的设计案例的重新思考。
人工智能的哪些发展最令您惊讶或兴奋?
我发现生成基础模型的功能非常令人惊讶,例如能够生成文本(ChatGPT、Bard)和图像(DALL·E 2、Stable Diffusion)的模型。最近,结合多种数据类型来训练多模态 LLM(MLLM)引发了新一轮的兴奋浪潮,一些 MLLM 已经集成了文本和图像,例如 GPT-4、Kosmos-1 或 GATO,其他一些甚至已经嵌入到机器人框架中,例如 PaLM-E。这些智能体的初步表现暗示它们可能是迈向通用智能的第一步。
尽管这些进展仍需要应用于蛋白质设计领域,但蛋白质固有的多模态和可用于自监督学习的未标记数据量表明这一应用是可行的,它可能使我们更接近实现具有可控特性的蛋白质设计。
您能举出人工智能如何改变科学过程的例子吗?
ChatGPT 等生成模型彻底改变了科学写作,引发了人们的疑问:如何将这些工具整合到我们的教育系统中,以及我们如何检测科学评论和出版中的不当行为。在蛋白质的特定背景下,研究领域在过去三年中经历了彻底的转变,从基于物理的方法转向人工智能引导的工具。
现在,我们不仅可以解决传统的蛋白质设计问题,而且我们也有丰富的方法来生成结构或序列,或者围绕给定的支架定义两者。这些人工智能模型在实验室环境中表现出显著提高的性能,减少了时间要求并提高了传统上具有挑战性的蛋白质设计任务的成功率。我们现在可以设计几年前超乎想象的蛋白质系统。
您对 2024 年以及未来 5 年的人工智能有何希望或期望?
我对各个人工智能领域的快速进步感到乐观,包括文本和图像生成、机器人技术和多任务自主代理。这些进展将很快扩大对蛋白质设计领域的影响。
在接下来的五年中,大型智能代理将会出现,无缝集成到机器人平台中。这些代理将有能力半自主地设计序列、分析序列并不断完善其设计,同时根据反馈提高其能力。这有望显著缩短工程周期并创建高效的设计。我相信,这项变革性技术将通过功能性蛋白质的定制开发来彻底改变众多行业,从而降低各种生物技术过程的成本,并为新的环保方法铺平道路。
更多作者信息
Yiyu Shi,圣母大学
医疗保健领域的人工智能和机器学习存在可持续性问题,并讨论了有助于解决这些问题的当前和未来的各种算法和系统创新。
论文链接:https://www.nature.com/articles/s42256-023-00670-0
Diana Mincu,Google Research
研究了研究管道中各部分的改进——数据集、工具和实践、问题制定、结果,一直到临床部署。
论文链接:https://www.nature.com/articles/s42256-022-00559-4
Marinka Zitnik,哈佛医学院
探讨了使用图来融合不同的数据模态,并以灵活和通用的方式利用跨模态依赖关系。
论文链接:https://www.nature.com/articles/s42256-023-00624-6
Nandana Sengupta,印度理工学院
探讨了人工智能技术与国家在 Global South 背景下交叉的一些具体方式。评论了立法行动的缓慢步伐与公共行政中算法的不断结合,以及迫切需要对这些地区的算法偏见和公众态度进行更多的量化实证研究。
论文链接:https://www.nature.com/articles/s42256-023-00621-9
Sebastian Porsdam Mann,牛津大学
讨论了与生成式人工智能的使用有关的各种伦理问题,突出了对其产出的道德责任的不对称。
论文链接:https://www.nature.com/articles/s42256-023-00653-1
Payel Das,IBM Research
强调了将「数据工作」作为人工智能研究的主流和不可或缺的组成部分进行实践缺乏激励和认可。通过提供示例并分享我们自己作为人工智能研究人员的经验,讨论了当前过度强调建模和算法工作的文化和务实因素。提出了改变现状的建议,将数据工作重新定义为技术上严格的,并将其整合到模型创新中。
论文链接:https://www.nature.com/articles/s42256-023-00673-x
Francesco Stella,代尔夫特理工大学
我们证明了像 GPT-4 这样的 LLM 可以在概念和技术层面上指导机器人的设计过程,并提出了人类与人工智能的协同设计策略。然后讨论了社会影响,强调了跨学科研究的机会,同时注意有关社区偏见、知识产权和认知任务自动化的问题。
论文链接:https://www.nature.com/articles/s42256-023-00669-7
参考内容:
https://www.nature.com/articles/s42256-024-00796-9 https://www.nature.com/articles/s42256-023-00784-5