在人工智能发展史上,2023 已经成为非常值得纪念的一年。在这一年,OpenAI 引领的 AI 大模型浪潮席卷了整个科技领域,把实用的 AI 工具送到了每个人手里。但与此同时,人工智能的发展也引起了广泛的讨论和争议,尤其在其商业应用和未来发展前景方面。著名 AI 专家 Rodney Brooks 在 2024 年初发文预言,认为 AI 可能即将进入一个新的寒冬,随着泡沫的破裂,行业可能面临严峻的挑战。他的这一言论引发了业界的广泛讨论:新的一年,AI 领域将会迎来更多的炒作,还是进入低谷?与此同时,还有不少人担心,AI 是不是会取代更多人的工作?在前不久的国际消费类电子产品展览会(CES)上,两位著名 AI 科学家、斯坦福大学教授李飞飞和吴恩达以此为契机展开了讨论。此外,他们还讨论了:新的一年,哪些 AI 技术将迎来新的突破?AI 智能体的崛起意味着什么?对生成式 AI 准确性存在顾虑的企业要怎么用好这项技术?以下是本次讨论的视频内容:
原视频链接:https://videos.ces.tech/detail/video/6344567556112/great-minds-bold-visions:-what% E2%80%99s-next-for-ai为了方便大家收藏具体内容,机器之心还将视频整理成了文字版: 主持人:首先我们来讨论一下第一个问题,这个问题与人工智能的当前状态有关。去年无疑是人工智能炒作非常疯狂的一年。 我们的好朋友 Rodney Brooks 在 1 月 1 日发推说:「现在该穿厚衣服了,可能又一个人工智能寒冬即将来临,而且会非常寒冷。」那么,在新的一年,AI 领域会迎来更多的炒作,还是低谷呢?吴恩达:我认为媒体会按照它们的方式去做事。但我们并不会进入寒冬,因为人工智能的商业基础比以往任何时候都要坚实,甚至在生成式 AI 浪潮来临之前就已经如此。去年,人工智能真正起飞了。它可能推动了数千亿,甚至数万亿美元的市场,这点我不确定。至少对像谷歌这样的公司来说是数千亿美元,因为展示更相关的广告可以带来大量的收入。所以 AI 的商业基础是存在的。其实,关于人工智能,最难理解的一点是,它是一种通用技术。这意味着它不仅仅对一件事有用。它有点像电力这样的通用技术,如果我问你电力有什么用,你会觉得很难回答,因为它的用途太广了。人工智能也是如此。就我们今天所处的阶段来说,即使人工智能无法取得任何技术核心进展,当然它肯定会取得进展。即使没有,世界各地都有很多用例等待被发现和构建。所以我非常有信心,它的商业基础将继续壮大。李飞飞:是的,我大体上同意 Andrew(吴恩达)的观点。我们看到的是人工智能的另一个拐点,这个拐点始于大型语言模型的发展,特别是 ChatGPT 的首次推出以及后续模型的推进。我认同 Andrew 的看法,AI 是一种深化的横向技术。作为一种深化的横向技术,它正成为下一次数字革命或工业革命的重要推动力。公共媒体的报道,会呈现波动,但这不是最关键的。重要的是,这项技术已经根植于我们的生活。它正在深入到所有垂直行业和消费者体验中,逐渐改变我们的社会、经济和政治结构。这是不争的事实。而且这种改变正在变得越来越明显。主持人:让我们跳到你们对 2024 年重大突破的预测。你们认为今年 AI 的最大突破会是什么?李飞飞:预测未来总是非常危险的,因为我说错的话会被引用。从计算机视觉和所谓的以像素为中心的 AI 领域来说,我确实认为我们正处于非常激动人心的技术进步的边缘。我们一直在关注生成式 AI,我们一直在研究扩散模型,有人可能听说过 Gaussian splatting 或这方面的内容。我认为目前的技术浪潮中,有许多成果几乎就要实现突破了。我不确定它是否会像一年多以前的大型语言模型那样成熟,但我越来越多地看到这一点。我对此非常兴奋。主持人:Andrew,你怎么看?吴恩达:是的,我也有几个预测。首先,我们看到了大型语言模型的突破。我同意飞飞关于图像的看法。所以我看到的是,从大型语言模型到大型视觉模型的转变。很多进步不仅仅在于图像生成,图像分析也在进步,它能提高计算机的视觉能力,这对自动驾驶汽车等领域有很大的影响,比如任何带有摄像头的地方。这是第一点。第二点我想说,你向 ChatGPT 提问,它会立即作出回应。但我更感兴趣的是自动化智能体的崛起。当你给 AI 系统一个指令,比如说「亲爱的 AI 系统,帮我做市场调研,对这个公司进行竞争分析。」智能体不会立即给出回应,而是规划一系列动作,比如进行网络搜索、下载网页、总结信息。它会去做半小时、一小时或一天的工作,然后带着答案回来。自动化智能体能够规划和执行一系列动作。它们现在刚刚起步,但在研究和商业化方面有很多进展。我期待在接下来的几个月里,会有新的突破。最后一点,可能也适用于 CS 领域,我对边缘 AI 非常感兴趣。我经常在我的笔记本电脑上,运行大型语言模型。我经常用 GPT-4,也经常用 Bard。但很多人不知道的是,在你的笔记本电脑上运行大型语言模型实际上已经相当可行。虽然这些模型不像 GPT-4 那么大,但也够用了。我认为这件事意义深远。所有的 PC 制造商,难道不会想要销售给消费者一个更强大的 PC,让他们使用最新的 AI 技术吗?显卡通常是人们升级电脑的一个动因。我认为在你的笔记本电脑、PC 或你的工业 PC 上运行的边缘 AI,它的能力实际上比大多数人认为的要好得多。对 CS 领域来说,我认为这将推动很多设备的销售。李飞飞:我有一点点不同的意见。你提到了「自主智能体」,但我更倾向于将其称作「辅助智能体」。我们在当前的大型语言模型和这些庞大的基础模型中观察到,处理长尾问题依然是个挑战,无论是在幻觉现象还是其他方面。在很多工作环境中,为了提供高品质的服务和产品,关注长尾分布非常重要。因此,我认为更可能出现的是人机交互式协作。在这种模式下,辅助智能体既包含了自主工作的部分,也包含了与人类的协作部分。这比完全自动化更有可能成为现实。吴恩达:确实如此(击掌)。我其实在一定程度上同意你的看法。我想分享我的经历。「自主智能体」这个词可能有些问题,但我在商业领域看到的是,大多数人更愿意让 AI 辅助人类,而不是替代人类,尤其是考虑到失业的问题,这是一个现实挑战。我不想忽视那些失业者的苦难。我观察到的是,决定是否使用 AI 来自动化或取代人力,通常更多是基于商业经济来考虑,而不是基于伦理。或许这应该是一个伦理决策,但诚实地说,当我与企业合作建立聊天机器人时,我看到大多数企业都会进行非常理性的经济评估。人类能够带来这些价值,人工智能能够带来那些价值,他们关心的是怎么做是最佳的经济决策,毕竟竞争者也在做相同的事情。我希望我们能说「不要取代人类的工作」,但不幸的是……主持人:关于这种类型的 AI 智能体,我想引用 Mira Murati 的一句话。她说,「AI 智能体的概念并不新鲜,但现在我们正在向未来迭代,发展出具有智能和常识的智能体,它们理解我们为什么要做某些事情。」李飞飞:好的,我想补充一点,也对那个观点发表评论。我认为我们需要谨慎区分取代「工作」和取代「任务」。我相信,你我都看过相同的报告。报告表明,人类的每项工作实际上都是由多个任务组成的。我花了很多时间研究医疗保健。一名护士在值班的 8 小时里要完成数百项任务。AI 智能体确实在许多任务中发挥辅助和增强的作用,但我们需要慎用「工作」这个词。我确实认为,经济商业决策与伦理社会决策并不是互斥的。这是一个更深入的讨论,我知道你和我意见是一致的。回到你关于这些智能体有理解能力的问题。我认为这是一个非常微妙的术语,仅关注商业方面。什么是理解?有对数据中存在的模式的理解,有对你所做决策的理解,还有对任何人类任务意图的理解。所以,实际上,我不会简单地用一个笼统的「理解」这个词来描述今天的 AI 智能体。主持人:你认为 AI 智能体会在何时达到什么程度?李飞飞:我认为我们目前做得最好的是理解数据中的模式,尤其是当我们有大量的训练数据时,我们做得非常好。我指的是大型语言模型,使用基于序列到序列的基于 transformer 的算法,我们真的做得很好,从数据中提取模式,以创造强大的预测模型。所以我认为,这可能是最前沿的。再次强调,我认为「理解」要微妙得多。你们都来自商业领域,知道其中的细微差别,我认为还有更多工作要做。至于意图理解,我认为我们只是触及了表面。吴恩达:我想回到任务的话题,因为我认为这很重要。我的团队为很多企业工作,偶尔我会接到首席执行官的电话。他们说:「嘿,Andrew,我读了关于 AI 智能体的文章,我该怎么做?」结果表明,有一种方法,它能帮助企业确定哪些任务应尝试用 AI 增强或自动化。正如飞飞所说,大多数工作由许多不同的任务组成。以放射科医师为例,放射科医师阅读 X 射线影像,他们需要获取病人的病史,操作机器、维护机器、指导年轻医生等等。所以放射科是一个例子,涉及许多不同的任务。我所见过的企业做法是观察你的团队,了解你所有员工实际上在做什么任务,并且不是在职位层面,而是在任务层面分析。这项任务在多大程度上适合用 AI 去增强或自动化以及业务投资回报率如何。每次我和企业一起做这个工作时,我们总是能想出很多点子,但我们没有时间去实施。所以 AI 的增强或自动化有很多机会我学到的第二点是投资回报率最高的任务,往往不是人们最初所想到的那个。以放射科医师为例,人们通常会想到,哦,放射科医师就是看 X 光片的。这是你的脑海中关于这个职业的定位画面。但当我们去分解这项工作时,我们会发现有很多其他任务,比如收集病人病史之类的。这些任务可能更容易实现,而且投资回报率更高。所以我发现,系统地进行这个练习,通常有助于企业识别有价值的机会,然后进行构建与购买的决策,执行 AI 项目。主持人这正是我想谈的下一个话题。让我们讨论一些更加实际的问题,在与财富 500 强公司的合作中,你有没有发现,那些有着清晰的、可证明的、可实现的投资回报率的应用都有哪些共性?比如,你觉得这个房间里的大多数人应该专注于哪些应用?吴恩达:如果我们广泛观察财富 500 强公司,我认为常见的应用是客户运营或客户支持。有很多公司试图增强或自动化客户支持。我认为软件工程也在转变。我们对软件工程师的支持远远超出了 Github Copilot。Github Copilot 是一个不错的工具,但我们能做的远不止这些。我认为销售运营也受到了很大影响。但对于特定企业而言,几乎每家公司都在做客户运营,所以你也应该认真考虑这个方面。但更激动人心的事情是,我和一家非常大的农业公司谈过,我们确定了一些任务。这不是你想到的那种收割任务,而是一些奇怪的任务。我们认为或许可以使用 AI,来大大节省他们的时间。所以,适合你的业务和行业特色的小众领域,我认为通常更引人入胜。它们不仅有趣,还能创造出特定于行业的防御性飞轮效应。因为每个人最终可能都会购买一些通用的销售运营工具等,但那些特定于你业务的东西,你应该在内部构建,我觉得这些事情非常令人兴奋。李飞飞:现在确实有各种各样的客户支持或运营解决方案。但我想补充的一点是,我们还可以在当前技术中寻找共同的机会。我认为有个结论今天依然成立,那就是,在数据最丰富的地方,你可以从中识别出可重复或有效的模式,无论是人类语言模式、结构化数据模式还是图像数据模式。数据所在的地方,以及数据模式被证明在你的业务中有价值且可操作的地方,就是你应该关注的地方。主持人:让我们谈谈财富 500 强 CEO 可能面临的障碍。我们上周日举行了医疗保健峰会,会上有几位医疗保健 CEO 出席。我们问其中一位,你对数字创新最感兴趣的是什么?他说人工智能。然后我问他,作为 CEO,你最担心什么?他说,不准确性。李飞飞:这是最难的行业之一。主持人:你想对那些将不准确性上升为 CEO 级别关切的 CEO 说些什么?在你看来,还有哪些问题可以上升到这个级别?李飞飞:就像我之前所说的,这取决于你的产品、你的服务以及结果的利害程度。在医疗保健、金融预测等许多行业中,长尾精确性非常重要。你不能承受人命损失或人身伤害,你不能承受银行出错。所以你需要了解你的行业,了解你的解决方案和服务,看看 AI 可以在哪里发挥真正的作用。这就关系到你说的炒作。当我与商业高管交谈时,我们应该摒弃炒作,理解这项技术能做什么,避免投资于那些 AI 还不擅长的方向。主持人:那么飞飞,类似医疗保健这种涉及生死和高度监管的行业,他们想用生成式 AI,但又担心准确性问题,你想对他们说些什么?李飞飞:Andrew 和我都在医疗保健领域工作了很久。实际上,医疗保健中有大量的 AI 应用,从非常上游的药物发现开始,我们可以做很多事情。主持人:我想说的是生成式 AI李飞飞:这是一个信息过载的词。今天,每种 AI 都被称为生成式 AI。在 Andrew 和我的早期研究中,我们有非常具体的数学定义来定义生成式 AI。但现在,我们……吴恩达:我们之前管它叫机器学习,但机器学习……李飞飞:我们还曾经区分生成式 AI 和判别式 AI。如今,这种数学严谨性已经消失了。吴恩达:是的,我觉得大众媒体已经接管了技术术语。技术界也只是跟着适应。李飞飞:确实如此。所以,当你说生成式 AI 时,我假设你指的是那种大数据驱动的有预训练阶段的模型。有些人可能会将 transformer 和预测模型纳入其中,但我不确定是不是总是这样。但无论如何,我认为如果真的存在准确性问题,我们应该检查几个方面,比如这是模型的问题,还是数据质量的问题?是因为把 AI 引入流程才有了这个问题吗?导致结果不准确的商业问题有很多。你要弄清楚这些问题,并尝试解决它们。有时候,例如在某些医疗诊断和治疗层面,你确实需要认识到限制的存在,如果风险太高,我们不能过度推进。吴恩达:我补充一点,虽然我们使用 “生成式” 这个术语。但 AI 往往用于分析。我的团队已经做了很多项目,比如使用这些大型语言模型来阅读电子健康记录,试图得出结论,而不是撰写文本。即使你在写文本,如果你小心使用总结软件,也能得到不错的结果。它可能还会有一些错误,我认为在医疗保健环境中,如果某个场景风险不那么高,还是有很多部署这些技术的机会的。就诊断来说,如果你弄错了一些东西,那结果是很糟的。但我们部署了一个系统,目前仍在一家医院运行。该系统用于筛选患者、阅读电子健康记录,判断谁的死亡风险更高,并推荐他们考虑接受临终关怀。但我们无法信任系统做出的决定。所以我们把它送给医生,让医生复查我们展示的病例,并做出最终决定。实际上,我新加坡的一个朋友正在使用新加坡国立大学的一个系统,查看病人的电子健康记录,尝试估计病人将在医院待多久。有时医生会认为这是个简单的病例,三天内就会出院,但 AI 说不,需要 5 天。这就引发了进一步的讨论。这就是新加坡正在发生的事情。医生说,「哦,也许我需要再仔细看看这个病人。也许我漏掉了 AI 发现的东西」所以,这些东西实际上正在部署。但根据系统的能力,我们通常可以设计安全措施,确保以负责任的方式部署 AI。在医疗保健运营中,如果你使用 AI 来安排核磁共振机的试用,即使你犯了错误,导致核磁共振机使用效率降低,这虽然很糟,但也许并不像弄错关键诊断那么糟糕。所以实际上,AI 在医疗保健领域有很多部署机会,我认为几乎所有行业都是如此。主持人:那么,我们接下来讨论基础模型。这个问题的灵感来自我在科技网站上读到的一篇文章。如果说 2023 年是 OpenAI 高光之年。那么,在基础模型的领导者中,2024 年的主角将是哪个公司?苹果会推出 Ajax 大模型吗?我们对 Gemini 的关注会多于 GPT 吗?吴恩达:事实证明,每当出现一波技术创新时,媒体都喜欢谈论技术层面。所以媒体会关注 OpenAI、谷歌、AWS、微软、Meta、英伟达、AMD 等公司。这没什么问题。但事实证明,要让技术基础设施层成功,我们还需要成就另一个领域,那就是建立在这些技术提供商之上的应用层。坦白说,我们需要基于这些工具构建的应用来产生更多收入,以便它们能够为这些工具构建者买单。一篇很好的文章显示了 GPU 的资本投资。作为一个群体,我们需要创造一些应用,来填补这数百亿美元的空白,这是我们现在已经进行的资本投资,特别是在 GPU 方面。所以,我不知道媒体会做什么,他们有自己的炒作周期。但我认为大量的实际工作,不仅仅存在于基础模型那里,而是在医疗保健、金融服务、教育、电子商务等所有这些领域,去识别和执行项目。