AI行业研究
全球首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍
用 AI 提高 AI 的效率,它们就能变得像人类大脑一样高效?我们的大脑只用了 20 瓦的能量就能完成复杂思考,而现代 AI 系统却需要成排的高功率 GPU 和惊人的电...
出人意料!DeepSeek-R1用的GRPO其实非最优?规模化强化学习训练用PPO就够了
DeepSeek-R1 非常热门,而在其公布的训练配方中,GRPO(Group Relative Policy Optimization)非常关键,是 DeepSeek-R1 核心的强化学习算法。 PPO 与 GRPO ...
DeepSeek 全面指南:从入门到高级部署
DeepSeek 官方网站 访问 DeepSeek 的官方网址:https://www.deepseek.com/ DeepSeek 官方 API DeepSeek 的 API 开放平台:https://platform.deepseek.com/us...
豆包全新端到端语音功能发布!智商与情商双重在线,中文语音对话遥遥领先
大年底的,豆包又轰动了一把。 今天,豆包 APP 宣布全新端到端实时语音通话功能正式上线,不玩「预发布」,直接全量开放、人人免费使用,迎接每一个用户的检...
令人震撼!Claude伪对齐率竟达78%,Anthropic用论文揭开内幕
令人震撼!Claude伪对齐率竟达78%,Anthropic用论文揭开内幕
ChatGPT升级为生产力工具:Canvas全量开放,人+AI协作模式启动
今天是 OpenAI 十二天连更的第四天,OpenAI 准备革新的是生产力。是的,就是 OpenAI 在 10 月份宣布的「ChatGPT 写作和编程新方式」,Canvas。现在,用户可以...
UC伯克利探索GPT-5:使用当前模型预测未来模型的潜力
LLM 规模扩展的一个根本性挑战是缺乏对涌现能力的理解。特别是,语言模型预训练损失是高度可预测的。然而,下游能力的可预测性要差得多,有时甚至会出现涌现...
AI现场发了2万红包,打开了大模型Act时代
最近一段时间,大模型领域正在经历智能体(AI Agent)引发的革命。Anthropic 推出的升级版 Claude 3.5 Sonnet,一经推出即引爆了 AI 圈。作为新一代 AI 智能...
诺奖得主哈萨比斯新研究发表于Nature,AlphaQubit解码更稳定量子计算机
谷歌「Alpha」家族又壮大了,这次瞄准了量子计算领域。 今天凌晨,新晋诺贝尔化学奖得主、DeepMind 创始人哈萨比斯参与撰写的新论文登上了 Nature,主题是如...
训练GPT-2只需5分钟,Andrej Karpathy也为此点赞
还记得 Andrej Karpathy 纯 C 语言复现 GPT-2 大模型的项目吗?今年 4 月,AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的...