视频里有前男友?谷歌最新AI视频生成器 Lumiere,轻松让他消失
机器之能报道编辑:SIA最喜欢的视频里有前男友?现在,你可以轻松将他删除了。事实再次证明,AI 生成视频技术的发展速度令人瞠目。过去几个月,我们一直挣扎...
AI国际顶会ICLR 2024结果揭晓,蚂蚁集团11篇论文入选
近日,人工智能顶会之一ICLR 2024录用结果揭晓,蚂蚁集团有11篇论文被收录,其中1篇为Oral,3篇为Spotlight,7篇为Poster,蚂蚁集团在AI学术领域的进展受到关...
《幻兽帕鲁》爆火,大厂坐不住了:这游戏是AI设计的?
疑似用 AI 卷设计,遭同行炮轰。最近,很多社交网络平台都被一款开放世界生存游戏刷了屏。《幻兽帕鲁》(Palworld)是当下最热门的话题之一,它在 1 月 19 日...
大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一
去年,在加速大语言模型推理层面,我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今,关于 Medusa 终于有了完整技术...
买个机器人端茶倒水有希望了?Meta、纽约大学造了一个OK-Robot
如果有个这样的机器人,你几点回家?「xx,去把电视柜上的遥控器帮我拿过来。」在一个家庭环境中,很多家庭成员都不免被支使干这种活儿。甚至有时候,宠物狗...
首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024
能够有效实现多模态交叉提示跟踪。目标跟踪是计算机视觉的一项基础视觉任务,由于计算机视觉的快速发展,单模态 (RGB) 目标跟踪近年来取得了重大进展。考虑到...
画个框、输入文字,面包即刻出现:AI开始在3D场景「无中生有」了
现在,通过文本提示和一个 2D 边界框,我们就能在 3D 场景中生成对象。看到下面这张图了没?一开始,盘子里是没有东西的,但当你在托盘上画个框,然后在文本...
Yann LeCun:生成模型不适合处理视频,AI得在抽象空间中进行预测
AI 理解视频不能依靠在像素空间中预测。在互联网文本数据即将枯竭之际,很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。在 2024 世...
纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了
人类有两只眼睛来估计视觉环境的深度信息,但机器人和 VR 头社等设备却往往没有这样的「配置」,往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称...
MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数
性能与 Mamba 一样,但所需训练步骤数却少 2.2 倍。状态空间模型(SSM)是近来一种备受关注的 Transformer 替代技术,其优势是能在长上下文任务上实现线性时...