GPT-4V数学推理如何?微软发布MathVista基准,评测报告长达112页

大型多模态模型会做数学题吗?在微软最新发布的 MathVista 基准上,即使是当前最强的 GPT-4V 也会有「挫败感」。微软最近发布了名为 “MathVista” 的全新多模...

全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%

本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了 HyperAttention,使 ChatGLM2 在 32k 上下文长度上的推理时间快了 50%。Transformer...

破解自注意力推理缺陷的奥秘,蚂蚁自研新一代Transformer或实现无损外推

随着大语言模型的快速发展,其长度外推能力(length extrapolating)正日益受到研究者的关注。尽管这在 Transformer 诞生之初,被视为天然具备的能力,但随着...

MIT 开发​深度化学模型的神经尺度策略,发现「神经尺度」定律

编辑 | 绿萝在数据可用性和计算方面,大规模使得自然语言处理和计算机视觉等深度学习关键应用领域取得了重要突破。越来越多的证据表明,规模可能是科学深度学...

低成本快速定制大模型,这次我们来深度探讨下RAG 和向量数据库

当今人工智能领域,最受关注的毋庸置疑是大模型。然而,高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下,向量数...

Runway新功能「运动笔刷」再次惊艳AI圈:随手一涂,图片就动起来了

网友:我都不敢想象一年后的视频技术会有多先进。一段五十秒的预告视频,再次让 AI 圈沸腾了。昨日 Runway 宣布,即将在视频生成工具 Gen-2 中上线「Motion B...

斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习

我们知道,ChatGPT 的成功离不开 RLHF 这个「秘密武器」。不过 RLHF 并不是完美无缺的,存在难以处理的优化难题。本文中,斯坦福大学等研究机构的团队探索用...

GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒

在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。OpenAI 提出的建议指出,精确、详细且具体的问题...

顶配MacBook Pro 16上的M3 Max是什么水平?有人花56000元进行了评测

能取代酷睿 i9 和 RTX 显卡吗?10 月 31 日,苹果在「史上最短发布会」上发布了新一代笔记本电脑和 Mac,与之而来的还有新一代 M3 芯片。新一代芯片第一次使...

英伟达特供版芯片将上市:性能最高不到H100的20%

国内芯片未来能否实现替代?10 月 17 日,美国商务部放出最严对华出口管制规定,H800 等 AI 加速器成为制裁的焦点。因为制裁涉及显卡功率和算力的限制,继 H1...
1 82 83 84 85 86 196