DeepMind指出「Transformer无法超出预训练数据实现泛化」,但有人投来质疑

难道 Transformer 注定无法解决「训练数据」之外的新问题?说起大语言模型所展示的令人印象深刻的能力,其中之一就是通过提供上下文中的样本,要求模型根据最...

马斯克第二款AI产品PromptIDE公布,Grok的开发离不开它

网友:xAI 团队的开发速度简直是疯了!距离马斯克的 xAI 公布 Grok 才过去一天,刚刚,xAI 又公布了另一款 AI 产品,一个可用于 prompt 工程和可解释性研究的...

让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider

大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此...

中国信通院华东分院征集2023长三角制造业数字化转型试点示范

随着新一代信息技术不断突破,数字浪潮正在向各产业各领域广泛传播和渗透,正在深刻改变经济社会运行模式。数字技术创新和数字经济发展已经成为推进新型工业...

MathGPT大模型发布:落地学而思AI学习机

近日,按照《生成式人工智能服务管理暂行办法》规定,学而思大模型MathGPT完成了相关备案并已通过审核,正式成为首批通过备案的教育大模型。据好未来透露,随...

科大讯飞ICDAR 2023收获四冠,图文识别理解新一程

作为文档图像分析识别领域最重要的国际会议之一,国际文档分析与识别会议ICDAR 2023(International Conference on Document Analysis and Recognition)近期...

GPU推理提速4倍,256K上下文全球最长:无问芯穹刷新大模型优化记录

想用大模型赚钱?这个实力强劲的新面孔决定先把推理成本打下来。大模型业务到底多烧钱?前段时间,华尔街日报的一则报道给出了参考答案。报道显示,微软的 Gi...

马斯克xAI公布大模型详细进展,Grok只训练了2个月

「Grok 是一款仿照《银河系漫游指南》设计的 AI…… 这是我们通过两个月的训练能够达到的最佳效果」近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 Open...

李开复官宣「全球最强」开源大模型:一次处理40万汉字、中英均霸榜

李开复表示,「零一万物要跻身全球大模型第一梯队。」开源大模型宇宙又有了新的重量级成员,这次是创新工场董事长兼 CE0 李开复大模型公司「零一万物」推出的...

元象XVERSE-65B:国内最大开源模型来了,高性能无条件免费商用

国内此前开源了多个 70 到 130 亿参 数大模型,落地成果涌现,开源生态系统初步建立。随着智能体等任务复杂性与数据量的提升,业界与社区对更「大」模型的需...
1 89 90 91 92 93 196