吞吐量提升5倍,联合设计后端系统和前端语言的LLM接口来了

大型语言模型 (LLM) 越来越多地用于需要多个链式生成调用、高级 prompt 技术、控制流以及与外部环境交互的复杂任务。然而,用于编程和执行这些应用程序的现有...

AIGC时代的「数字生命计划」已启动!

从碳基生命到硅基生命的剧变正在悄然降临。即使总是伴随着关于伦理、人性与法律等问题的争论,人类从来没有放弃过挣脱时空限制、实现灵魂永恒的尝试。近几年...

论学手艺,波士顿动力机器人可不是他们的对手

机器之能报道编辑:陈萍、Sia波士顿动力机器人运动技能的提升并没有很大程度改善人形机器人进入日常家庭服务的能力。基于大型语言模型(LLM)的生成 AI 取得...

奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞

这项工作代表了 AI 在数学推理上的能力突破,是开发通用 AI 系统方面的重要里程碑。这一次,人工智能算法在数学奥林匹克竞赛(IMO)上取得了重大成绩突破。在...

模型越大,性能越好?苹果自回归视觉模型AIM:没错

视觉模型,同样遵循「参数越多性能越强」的规律?刚刚,一项来自苹果公司的研究验证了这个猜想。过去几年,大规模预训练模型在 NLP 领域取得了成功,这类模型...

三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5

对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型 AI 的一个光明的方向。在对话型人工智能(AI)研究中,存在趋势即朝着开发参数...

新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度

Lightning Attention-2 是一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。大语言模型序列长度的限制,极大地制约了其在人工智能...

参会指南|倒计时 2 天,AI 视频生成论坛即将开启!

「视频生成前沿研究与应用」机器之心 AI 技术论坛将于本周六(1月20日)正式开启。本次活动是 2024 年机器之心主办的首场线下交流活动,期待到场的朋友们都能...

数智上海 2023 峰会 | 上海云网协同高性能算力基础设施建设进展如何?产业链各方分享最新进展

云赛智联所属上海科技网络通信有限公司总经理肖晓滨,中国通信服务上海公司绿色数据中心产品基地技术总监王斌,联通(上海)产业互联网有限公司副总经理朱奕...

数智上海 2023 峰会 | 如何做好数字金融大文章?这些金融机构、科技企业以及数字供应链企业这么说

2023 年 10 月的中央金融工作会议首次系统提出了金融「五篇大文章」,其中「数字金融」占据重要篇幅。基于此,日前圆满落幕的数智上海 2023 峰会上,特别举办...
1 49 50 51 52 53 196