系统Prompt长达1700个token,ChatGPT变「懒」的原因找到了?

ChatGPT:我不是不会,就是不想干活。现阶段,ChatGPT 已经成为很多人的得力助手,写文档、编代码、生成图片…… 但看似无所不能的 ChatGPT,也有其懒惰的一面...

PRO | 为什么基于 MoE 的大模型更值得关注?

2023年,几乎 AI 的每个领域都在以前所未有的速度进化,同时,AI也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。多模态趋势下,Transformer 作为 ...

开源大模型正在重塑企业AI应用,16个案例看看它们如何落地

企业运作新引擎:开源大模型。各种性能优异的大模型横空出世,开源大型语言模型在企业界的应用也逐渐引起广泛关注。不过,这也使新的问题浮出水面,企业应该...

大语言模型的可信之路:TrustLLM全面揭秘

TrustLLM 是一个统一的框架,用于对 LLM 的可信度进行全面分析,包括现有工作的全面综述、可信 LLM 的不同维度的原则、一个新的测试基准,以及对主流 LLM 的...

黄仁勋:从此之后,请叫我黄院士

I am AI.北京时间 2 月 7 日凌晨,美国国家工程院(National Academy of Engineering, NAE)公布了今年的新增院士名单。院长约翰・L・安德森(John L. Anders...

无需RLHF显著提升GPT-4/Llama2性能,北大团队提出Aligner对齐新范式

对齐新范式:修正未对齐的答案比生成对齐的回答更容易。背景大语言模型(LLMs)虽展现出了强大的能力,但也可能产生不可预测和有害的输出,例如冒犯性回应、...

斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了

在我们的工作群里,经常会有一位管理者来协调每个人的工作并汇总工作成果。近日,斯坦福大学的 Mirac Suzgun 和 OpenAI 的 Adam Tauman Kalai 提出了一种新的...

抛弃编码器-解码器架构,用扩散模型做边缘检测效果更好,国防科大提出DiffusionEdge

现有的深度边缘检测网络通常基于包含了上下采样模块的编码器 - 解码器架构,以更好的提取多层次的特征,但这也限制了网络输出既准又细的边缘检测结果。针对这...

吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速

MAGNeT 有望改变我们体验音乐的方式。在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。前几日,在论文《Masked Audio Gene...

传苹果VisionPro 4或5月登陆中国,大厂应用火速跟进

机器之能报道编辑:SiaApple Vision Pro 目前仅在美国推出,但从一开始就有报道称它将很快在国际上推广。《华尔街新闻》快讯报道,供应链预计该产品最早可能...
1 35 36 37 38 39 196