活动预告丨2024中国具身智能大会 3月29-31日与您相约上海!
由中国人工智能学会主办,CAAI具身智能专委会(筹)、同济大学、中国科学院计算技术研究所、上海交通大学联合承办的中国具身智能大会(CEAI 2024)将于2024年...
前端不存在了?盲测64%的人更喜欢GPT-4V的设计,杨笛一等团队新作
前端工程师是不是开始慌了?3 月 9 日央视的一档节目上,百度创始人、董事长兼 CEO 李彦宏指出,以后不会存在「程序员」这种职业了,因为只要会说话,人人都...
Pika推出音画同步新功能一天后,翻车视频来了
Pika 的音效新功能「Sound Effects」,有大大的惊喜,也有小小的「惊吓」。Sora 的出现让文生视频模型及应用火了起来。不过,此类模型生成的视频大多数都是无...
零一万物自研全导航图向量数据库,横扫权威榜单6项第一
3 月 11 日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。向量数据库,...
DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升
近期,来自华为诺亚方舟实验室的研究者提出了 DenseSSM,用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中,DenseSSM 保留了对...
当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」
近年来,大语言模型(LLMs)由于其通用的问题处理能力而引起了大量的关注。现有研究表明,适当的提示设计(prompt enginerring),例如思维链(Chain-of-Thou...
基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了
这个模型和 Sora 一样采用了 DiT 框架。众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了 AI...
LeCun最新专访:为什么物理世界终将成为LLM的「死穴」?
在人工智能领域,很少有像 Yann LeCun 这样的学者,在 65 岁的年龄还能高度活跃于社交媒体。一直以来,Yann LeCun 都是以「直言不讳的批评者」形象活跃于人工...
用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成
在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长...
怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相
在 ChatGPT API 中,系统提示是一项很有亮点的功能,它允许开发人员控制 LLM 输出的「角色」,包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令...