用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成
在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长...
怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相
在 ChatGPT API 中,系统提示是一项很有亮点的功能,它允许开发人员控制 LLM 输出的「角色」,包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令...
奥特曼重返OpenAI董事会:看完3万份文件,调查组认定了
过山车一样的剧情。特别独立调查委员会发现,在去年 OpenAI 管理层动荡时,首席执行官萨姆・奥特曼(Sam Altman)的行为「不构成强制解雇」,现在他重新加入...
教授何恺明在MIT的第一堂课
700 座的大教室,相比去年增加一倍容量,仍然座无虚席:这就是麻省理工学院(MIT)计算机视觉课《Advances in Computer Vision》6.8300 在 2024 新学期的盛况...
谷歌具身智能新研究:比RT-2优秀的RT-H来了
RT-H 在一系列机器人任务中的表现都优于 RT-2。随着 GPT-4 等大型语言模型与机器人研究的结合愈发紧密,人工智能正在越来越多地走向现实世界,因此具身智能相...
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。近期的研究表明,采用扩散模型的规...
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀
剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团...
Sora 竞争对手融资数千万美元,目前可免费“薅”
机器之能报道编辑:Sia效果确实没法和Sora比,但和其他对手水平差不多。对于需要快速、低成本地制作商业推广视频的主体来说,又多了一个不错的选择。情绪的所...
预测所有生物分子,David Baker 团队蛋白质设计新工具 RoseTTAFold All-Atom 登 Science
编辑 | ScienceAI在蛋白领域,华盛顿大学 David Baker 团队又带来了新进展。蛋白质是生命存在不可或缺的分子,但它们不是细胞中唯一的分子,参与生命过程它们...
清华姚班本科生连发两作,十年来最大改进:矩阵乘法接近理论最优
通过消除「隐藏的低效」问题,计算机科学家提出了一种比以往更快的大型矩阵相乘新方法。矩阵乘法作为众多 GPU 算子的基础操作,是高性能计算的重要问题之一,...