拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
去年 5 月,动动鼠标就能让图片变「活」得研究 DragGAN 吸引了 AI 圈的关注。通过拖拽,我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴...
首个AI软件工程师Devin完整技术报告出炉,还有人用GPT做出了「复刻版」
从编码、编译到调试、验证,AI 智能体能做的事情更多了。这周三,Cognition AI 团队发布的首个 AI 软件工程师 Devin 引爆了 AI 社区,引发了人们对程序员这个...
从直观物理学谈到认知科学,Sora不是传统物理模拟器盖棺定论了?
本文篇幅很长,主题很多,但循序渐进,对「Sora 究竟是不是世界模拟器」这一说法给出了非常详实的解读。最近,OpenAI 的文生视频模型 Sora 爆火。除了能够输...
大模型能自己优化Prompt了,曾经那么火的提示工程要死了吗?
人类设计 prompt 的效率其实很低,效果也不如 AI 模型自己优化。2022 年底,ChatGPT 上线,同时引爆了一个新的名词:提示工程(Prompt Engineering)。简而言...
COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim
基于 Transformer 结构的视觉语言大模型(VLM)在各种下游的视觉语言任务上取得了巨大成功,但由于其较长的输入序列和较多的参数,导致其相应的计算开销地提...
流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?
「质疑图恒宇,理解图恒宇,成为图恒宇。」在《流浪地球 2》中,刘德华饰演的图恒宇是一个令人印象深刻的角色。为了让在车祸中去世的女儿拥有「完整的一生」...
苹果为杀入AI领域低调收购,iOS 18要有大动作
苹果一直是人工智能公司的最大买家,甚至超过了微软和谷歌。在 AI 领域百花齐放的当下,作为全球顶尖的科技公司苹果,似乎掀起的水花不是很大。苹果在 AI 领...
一句指令就能冲咖啡、倒红酒、锤钉子,清华具身智能CoPa「动」手了
近期,具身智能方向取得了诸多进展。从谷歌的 RT-H 到 OpenAI、Figure 联合打造的 Figure 01,机器人的交互性、通用性越来越强。如果未来机器人成为人们日常...
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述
大语言模型(Large Language Models, LLMs)在过去两年内迅速发展,涌现出一些现象级的模型和产品,如 GPT-4、Gemini、Claude 等,但大多数是闭源的。研究界...
中国电动汽车百人会2024丨毫末顾维灏:自动驾驶3.0时代,大模型重塑汽车智能化路线
“以大模型、大算力、大数据为代表的自动驾驶3.0时代已经到来,这些都是智能汽车新质生产力关键要素。毫末将以技术领先的‘极致性价比’智驾产品,助力车企智能...