博客 | 第 47 页 | 优智创想智能工具导航

视频里有前男友？谷歌最新AI视频生成器 Lumiere，轻松让他消失

机器之能报道编辑：SIA最喜欢的视频里有前男友？现在，你可以轻松将他删除了。事实再次证明，AI 生成视频技术的发展速度令人瞠目。过去几个月，我们一直挣扎...

AI行业动态

10个月前

AI国际顶会ICLR 2024结果揭晓，蚂蚁集团11篇论文入选

近日，人工智能顶会之一ICLR 2024录用结果揭晓，蚂蚁集团有11篇论文被收录，其中1篇为Oral，3篇为Spotlight，7篇为Poster，蚂蚁集团在AI学术领域的进展受到关...

AI行业动态

10个月前

《幻兽帕鲁》爆火，大厂坐不住了：这游戏是AI设计的？

疑似用 AI 卷设计，遭同行炮轰。最近，很多社交网络平台都被一款开放世界生存游戏刷了屏。《幻兽帕鲁》（Palworld）是当下最热门的话题之一，它在 1 月 19 日...

AI行业动态

10个月前

大模型推理速度飙升3.6倍，「美杜莎」论文来了，贾扬清：最优雅加速推理方案之一

去年，在加速大语言模型推理层面，我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今，关于 Medusa 终于有了完整技术...

AI行业动态

10个月前

买个机器人端茶倒水有希望了？Meta、纽约大学造了一个OK-Robot

如果有个这样的机器人，你几点回家？「xx，去把电视柜上的遥控器帮我拿过来。」在一个家庭环境中，很多家庭成员都不免被支使干这种活儿。甚至有时候，宠物狗...

AI行业动态

10个月前

首个通用双向Adapter多模态目标追踪方法BAT，入选AAAI 2024

能够有效实现多模态交叉提示跟踪。目标跟踪是计算机视觉的一项基础视觉任务，由于计算机视觉的快速发展，单模态 (RGB) 目标跟踪近年来取得了重大进展。考虑到...

AI行业动态

10个月前

画个框、输入文字，面包即刻出现：AI开始在3D场景「无中生有」了

现在，通过文本提示和一个 2D 边界框，我们就能在 3D 场景中生成对象。看到下面这张图了没？一开始，盘子里是没有东西的，但当你在托盘上画个框，然后在文本...

AI行业动态

10个月前

Yann LeCun：生成模型不适合处理视频，AI得在抽象空间中进行预测

AI 理解视频不能依靠在像素空间中预测。在互联网文本数据即将枯竭之际，很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。在 2024 世...

AI行业动态

10个月前

纪念碑谷式错觉图像都被「看穿」，港大、TikTok的Depth Anything火了

人类有两只眼睛来估计视觉环境的深度信息，但机器人和 VR 头社等设备却往往没有这样的「配置」，往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称...

AI行业动态

10个月前

MoE与Mamba强强联合，将状态空间模型扩展到数百亿参数

性能与 Mamba 一样，但所需训练步骤数却少 2.2 倍。状态空间模型（SSM）是近来一种备受关注的 Transformer 替代技术，其优势是能在长上下文任务上实现线性时...

AI行业动态

10个月前

视频里有前男友？谷歌最新AI视频生成器 Lumiere，轻松让他消失

AI国际顶会ICLR 2024结果揭晓，蚂蚁集团11篇论文入选

《幻兽帕鲁》爆火，大厂坐不住了：这游戏是AI设计的？

大模型推理速度飙升3.6倍，「美杜莎」论文来了，贾扬清：最优雅加速推理方案之一

买个机器人端茶倒水有希望了？Meta、纽约大学造了一个OK-Robot

首个通用双向Adapter多模态目标追踪方法BAT，入选AAAI 2024

画个框、输入文字，面包即刻出现：AI开始在3D场景「无中生有」了

Yann LeCun：生成模型不适合处理视频，AI得在抽象空间中进行预测

纪念碑谷式错觉图像都被「看穿」，港大、TikTok的Depth Anything火了

MoE与Mamba强强联合，将状态空间模型扩展到数百亿参数

相关文章

热门标签