CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法

单目动态场景(Monocular Dynamic Scene)是指使用单眼摄像头观察并分析的动态环境,其中场景中的物体可以自由移动。单目动态场景重建对于理解环境中的动态变...

53页PDF广泛流传,核心员工相继离职,OpenAI到底有什么秘密?

八卦络绎不绝,GPT-5 却一直没来。一份关于「OpenAI 在 2027 年实现 AGI」的 53 页 PDF,正在互联网上广泛流传。文档来源于一个名为「vancouver1717」的 X 账...

复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持

最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。现实世界本质上是多模态的,生物体通过不同的渠道感知和交换信...

一句话让图片动起来,苹果发力大模型动画生成,可直接编辑结果

苹果最新的 AI 工具可以使用文本描述为图像制作动画。现阶段,大模型惊人的创新能力持续影响着创意领域,尤其是以 Sora 为代表的视频生成技术,更是引领了新...

十年内出现AGI?下一代Gemini能感知环境?DeepMind CEO哈萨比斯畅谈AI

智能本质、对齐、Gemini、超人类AI和多模态、AGI……在这场干货满满的访谈中,Demis Hassabis可谓「知无不言、言无不尽」。「如果我们在未来十年内拥有类似 AGI...

RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba

去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择...

清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!

近期,清华大学和哈尔滨工业大学联合发布了一篇论文:把大模型压缩到 1.0073 个比特时,仍然能使其保持约 83% 的性能!自从大模型火爆出圈以后,人们对压缩大...

大一统视频编辑框架:浙大&微软推出UniEdit,无须训练、支持多种编辑场景

随着 Sora 的爆火,人们看到了 AI 视频生成的巨大潜力,对这一领域的关注度也越来越高。除了视频生成,在现实生活中,如何对视频进行编辑同样是一个重要的问...

马斯克起诉OpenAI:他们做出了AGI还授权给微软,这是对创始协议赤裸裸的背叛

AGI 做出来了吗?创始协议在哪儿?马斯克起诉 OpenAI 的诉讼文件疑点满满。在刚刚过去的一天,「沉湎于戏剧性冲突」的马斯克又做了一件新鲜事:他起诉了自己...

2万多亿美元,英伟达市值创新高,华尔街排第三

这么看来,老黄的身家又涨了。英伟达,现在已是「地球上最重要的一支股票」了。据路透社消息, 在戴尔发布乐观报告后,英伟达股市价值在周五收盘首次超过 2 ...
1 20 21 22 23 24 196