百川智能发布超千亿大模型Baichuan 3,中文评测水平超GPT-4

1 月 29 日,百川智能正式发布千亿参数的大语言模型 Baichuan 3。在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 都展现了出色的能力,...

哈工大联合快手提出CogGPT:大模型也需要认知迭代

在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通...

OpenAI新模型用的嵌入技术被网友扒出来了

学起来吧。前几天,OpenAI 来了一波重磅更新,一口气宣布了 5 个新模型,其中就包括两个新的文本嵌入模型。我们知道,嵌入是表示自然语言或代码等内容中概念...

线上课程开售!暨视频生成前沿研究与应用 AI 技术论坛圆满收官

致力于助力企业和广大从业者掌握 AI 视频生成技术前沿,把握时代机遇的“视频生成前沿研究与应用”——机器之心 AI 技术论坛日前圆满收官。活动当天,北京西城昆...

更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目

近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。...

被大V推荐的AI论文,被引量会翻倍?两位推特博主5年推文背后影响揭秘

在 AI 领域,推特博主的影响力可能比想象中要大。经常在 X 平台(推特)上浏览 AI 论文的研究者应该都很熟悉两位博主:AK (@_akhaliq) 和 Aran Komatsuzaki (...

何恺明谢赛宁团队步步解构扩散模型,最后竟成经典去噪自编码器

去噪扩散模型(DDM)是当前图像生成技术的一大主流方法。近日,Xinlei Chen、Zhuang Liu、谢赛宁与何恺明四人团队对 DDM 进行了解构研究 —— 通过层层剥离其组...

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

融合多个异构大语言模型,中山大学、腾讯 AI Lab 推出 FuseLLM随着 LLaMA、Mistral 等大语言模型的成功,各家大厂和初创公司都纷纷创建自己的大语言模型。但...

重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型

AI 生成 3D 模型最难的一关,终于被搞定了。无需任何训练数据,只需对着模型描述一句话,如「一个做作业的香蕉人」:或是「一只戴着 VR 眼镜的猫」:就能生成...

15岁开公司,22岁再创业公司估值超20亿美金,Cohere CEO自述开挂人生

机器之能报道编辑:SiaAidan Gomez 是明星生成式 AI 创业公司 Cohere 的联合创始人兼 CEO,曾入选 2023 年《时代》杂志 100/AI AI 领域最具影响力人物名单。...
1 42 43 44 45 46 196