微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41
革命性的提升来了。把大模型的权重统统改成三元表示,速度和效率的提升让人害怕。今天凌晨,由微软、国科大等机构提交的一篇论文在 AI 圈里被人们争相转阅。...
LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训
LLaMa 3 正寻找安全与可用性的新平衡点。过去的图像生成模型常被人们诟病人物主要以「白人」为主,而谷歌 Gemini 正在因为它的矫枉过正而深陷翻车风波。它「...
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
作为 2024 开年王炸,Sora 的出现树立了一个全新的追赶目标,每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。根据 OpenAI 披露的技术报告,Sora ...
ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型
图像匹配是计算机视觉的一项基础任务,其目标在于估计两张图像之间的像素对应关系。图像匹配是众多视觉应用如三维重建、视觉定位和神经渲染 (neural renderin...
2024国际自动驾驶挑战赛正式开始
新赛题:七大赛道,赛题新颖,全方位覆盖相关领域最新最热话题,充分挖掘大模型在自动驾驶及具身智能垂直领域中的应用。高奖金:总奖金池超过12万美金,单赛...
火山引擎弹性容器实例:从节点中心转型 Serverless 化架构的利器
在 Kubernetes 和容器化技术愈发成熟的今日,越来越多企业开始将业务应用迁移到云上,采用云原生架构支持业务高速稳定地发展。而随着云计算向开发流程纵深发...
知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特
想要了解谷歌 Gemma 与 Llama 2、Mistral 有哪些异同吗?这篇文章值得一读。就在几天前,开源大模型领域迎来了重磅新玩家:谷歌推出了全新的开源模型系列「Ge...
反转?OpenAI:纽约时报「黑客攻击」了ChatGPT,要求驳回版权诉讼
去年年底,《纽约时报》向微软和 OpenAI 提起侵犯版权诉讼,指控其违规使用了《纽约时报》的内容来进行人工智能开发。在这份起诉书中,《纽约时报》列出了 GP...
苹果10年造车梦「夭折」,数十亿美元打水漂,特斯拉或成最大赢家
这下子,苹果再也不用频繁变更汽车的预计发布时间了。终于,近 3 万亿美元市值的苹果在电动汽车这个赛道「折戟沉沙」,成了正在消亡的车企大军中的一员。 ...
数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好
来自腾讯的研究者们做了一个关于 agent 的scaling property(可拓展性)的工作。发现:通过简单的采样投票,大语言模型(LLM)的性能,会随着实例化agent数量...