田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型
只用 24G 显存,消费级 GPU 就能搞定大模型了。上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM: Optimizing Sub-billion Paramete...
「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题
遮挡是计算机视觉很基础但依旧未解决的问题之一,因为遮挡意味着视觉信息的缺失,而机器视觉系统却依靠着视觉信息进行感知和理解,并且在现实世界中,物体之...
IEEE可解释AI体系架构标准P2894正式发布
可解释AI(XAI)是人工智能的一个新兴分支,用于解释人工智能所做出的每一个决策背后的逻辑,是人工智能可持续发展核心关注点之一。随着大模型时代的到来,模...
AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布
编辑 | XS2023 年 11 月,Nature 连续刊登了两篇重大成果:蛋白质生成方法 Chroma 和晶体材料设计方法 GNoME,均使用了图神经网络作为科学数据的表示工具。实...
击败GPT-4的那群人
机器之能报道编辑:吴昕很少有人注意到 Claude 3 兼顾安全的努力以及背后深刻动机。还有他们客户群体的特点。Claude 3绘制的它自己,在社交媒体上广为流传。G...
「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑
Karpathy:中肯的,一针见血的。如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架...
想搞AI,高中别学数据科学:奥特曼、马斯克此刻终于一致了
高中阶段学习数据科学能不能代替数学,这个话题的讨论已经延伸到了 AI 圈。为了 AI 的发展,再不加强基础教育就晚了。在大模型技术高速发展,各家公司激烈竞...
Sora 时代的 AI 视频生成何去何从?
Sora 作为 OpenAI 最新发布的视频生成模型,在全球范围内引起了热烈讨论。距离上一个引发全民讨论的视频生成模型 Pika 1.0 的发布,不到三个月的时间。Sora ...
Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时
Stability AI CEO Emad 表示他并不知情。Midjourney 把 Stability AI 拉入黑名单了,禁止后者所有员工使用其软件,直至另行通知。这两家 AI 图像生成公司之间...
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。沿袭 ViT 的研究思路,我们能否借助创新性的 LLaMA 架构,真...