机器之能报道
编译:吴昕
条条大路通罗马(AGI),虽然方式不同,但我们可以期待非具身 AGI 和具身 AGI 大致同时出现。
作为一家炙手可热的人形机器人赛道选手,1X 前阵子秀了一把 EVE 的新成果 。昨天,一直在 X 平台比较活跃的 1X AI 副总裁 Eric Jang 写了一篇文章,公开了其对AI 和机器人技术发展方向的一些预测。两年前,谷歌高级研究科学家 Eric Jang 离开 Google Robotics,加入 1X Technologies(原名 Halodi Robotics)负责 AI 工作。从那时起,AI 领域发生了很多事情,他也一直在思考 AI 之路将通往何处。
“许多 AI 研究人员仍然认为通用机器人还需要几十年的时间。但请记住,ChatGPT 的发生几乎就在一夜之间。”他在昨天的文章中写道,“我认为,这也将发生在机器人技术上。一旦发生这种情况,计算本身将彻底改变。” “最终,所有 AI 软件都会融合起来,看起就像机器人软件。”
1X 人工智能副总裁 Eric Jang接受播客节目的采访,讨论AI和人形机器人技术的发展前景,包括为什么现在是投资和建造通用机器人的最佳时机。
文章不算长。Eric Jang 首先谈到 1X AI 团队完成的两项重要工作,这些成就让他“非常自豪”。一个是通过端到端的神经网络,实现了人形机器人 EVE 的自主性。在这些视频中,EVE 掌握新技能都不用专业人士写代码,而是直接从数据中学习。这意味着未来扩展机器人能力的门槛大为降低——不用再受雇用专业人士以及他们撰写代码速度的限制。
随着时间推移,机器人功能会越来越受数据驱动,同时对专业知识的依赖性越来越低,这种机器人技术将更容易被更多没有技术背景的普通用户所接受。
“据我所知,1X 是第一家让数据收集系统自我培训的机器人公司。” Eric Jang 提到第二个让他骄傲的成绩。EVE 机器人透过数据来理解世界,因此,如何收集和管理训练数据比算法模型重要得多。为此,他们将 Meta VR Quest 头显设备变成了机器人的 AI 训练数据采集系统,并投入大量资金和人力提升数据质量。比如,一些没有机器学习背景的人也可以用自己收集的数据微调基础模型,从而领悟如何收集更高质量的数据。
公司的运维团队(无需专业的机器学习背景)自行教会机器人一些行为。
“这个办法确实缩短了收获良好模型的时间,因为收集数据的人可以非常快速地获得反馈,了解他们的数据有多好以及实际需要多少数据来解决机器人任务。”Eric Jang 预测,“这将成为未来收集机器人数据的普遍范式。”
公司的运维团队(无需专业的机器学习背景)自行教会机器人的一些行为。
1X、Figure、特斯拉等公司的技术路子都是一样的—— 建立完全通用的硬件、软件,应对各种现实案例。当然缺点是从来没有人解决过这个问题,但潜力无穷。这和当今大多数机器人公司提供价值的方式也完全不同。无论是叉车、割草机、扫地机还是焊接、喷涂或者拾取包裹的工业机械臂都是从一个很窄的领域开始,垂直整合硬件和软件,从来没有真正突破自己的利基市场走向通用领域。
现在,Eric Jang 和同事们正雄心勃勃地扩展模型,也发现机器人公司与 LLMs 公司所面临挑战有很多相似之处。他非常赞同一位同行的观点,“所有 AI 软件都将融合到机器人软件中”。或者说,所有 AI 软件最终都会融合起来,看起就像机器人软件。
他谈了一些观察和论据。当和那些思考职业发展的 AI 研究人员和工程师聊天时,他发现机器人领域往往不是这些人才的首选。原因也不难猜,过去机器人业务的成绩单乏善可陈,公司死亡率居高不下,未来也可能继续如此。更何况,现在有一大把更容易拿到投资的选择,比如聊天机器人、生成式 AI、颠覆搜索、智能助理、重新发明操作界面等等。
Eric 承认,在纯软件环境中部署机器学习更容易,因为比特(数字)世界是可预测的。机器人要和原子构成的物理世界打交道,所有外部信息都是未知的。你不知道你在哪里,其他东西在哪里,如果你接触到什么会发生什么(按下开关,灯是否亮?你甚至根本不知道是否按下了开关)。即使一些非常琐碎的事情,比如区分坐电梯下降和乘龙门吊上升都很困难,因为在惯性测量单元( IMU )传感器的眼里,这些力都很相似。区分不了的机器人最终会躺在地板上抽搐,因为它认为自己还有机会保持平衡。
但这种分别不应被过度强调。当 AI 软件开始接触现实世界时(比如用 LLMs 驱动的助手叫 Waymo),面临的挑战难度并不亚于机器人也很相似——应用程序与熵源交互时间越长,就更难保证程序行为正确性。“即使你没有造一个物理意义上的机器人,但你的代码库最终看起来就像一个现代机器人软件栈。” Eric 写道,还举了一些例子。
比如,他本人花了相当一部分时间在这些 LLMs 也会熟悉的工作上——确保数据加载器、日志管理平台的可扩展性,上传数据时确保可以将这些数据按 transformer 的时间因果序列排序。他还设计了一张表格,列举了机器人和 LLMs 所面临的类似挑战。
这张表格列举出了机器人和 LLMs 所面临的类似技术挑战
所有这些问题都很棘手,但并非不能解决。“尽管大多数 AI 公司和实验室不必考虑执行器硬件、电磁干扰或快速移动躯体带来的安全隐患,但机器人+研究过程中的工程技能,将是未来所有软件非常不可或缺的一个方面,而不仅仅只有控制机器人才需要。” Eric 写道。如果你接受这样一个前提—— LLMs 和机器人面临类似的工程和基础设施挑战,“那么,我们也可以期待非具身 AGI 和具身 AGI 大致同时出现。硬件这部分已经准备好了——就在过去 10 年发表的研究论文中。”
“许多 AI 研究人员仍然认为,通用机器人还需要几十年的时间。但请记住,ChatGPT 似乎是在一夜之间发生的。我认为,这也将发生在机器人技术上。一旦发生这种情况,计算本身将彻底改变。”
除了 AGI,Eric Jang 正在研究的主题之一还包括利润——如何将 1000 万美元 GPU 投入转化为 1000 万美元以上的利润。过去两年中筹集了千万甚至上亿美元、从头开始训练自己 LLMs 的初创公司都支付了巨大的成本,而现在基本上每个 AI 初创都能免费获得一些资源。“我认为,绝大多数成功的创业公司都能灵活地驾驭开源的潮流。”
“当然,我并不是说大胆下注训练 AGI 不是一个好主意;我只是认为,最适合这条路子是那些能将计算成本降到最低的公司。”否则的话,还是请严格遵守与能力相关的扩展定律和指标。“许多初创公司都在关注谷歌如何将在 Rankbrain 上投入的几十亿研发成本变成好几倍的利润,但他们也忘记了,这首先需要建立谷歌搜索业务。”
除了 GPU 的昂贵,Eric 也感慨当下人才成本之疯狂。“我曾与博士生交谈过,他们要求 7 位数的薪水。”这个数字让他想起六年前听闻 Open AI 联合创始人 John Schulman 薪水有 275k 时的感觉。
最后,Eric 预测 “ 这一代自动驾驶汽车公司将在未来几个月出现很多变化。同时,没有比现在更好的时机来创办一家全新的自动驾驶公司了。”
参考链接
https://evjang.com/2024/03/03/all-roads-robots.html