博客 | 第 82 页 | 优智创想智能工具导航

比ChatGPT早发两周，被喷下线的Galactica成了LeCun最大的意难平

今天我们提到大型语言模型（LLM），第一个想到的就是 OpenAI 的 ChatGPT。一年来，ChatGPT 因其强大的性能，广泛的应用前景而爆火出圈。但谈到大型语言模型，...

AI行业动态

1年前 (2023)

S-LoRA：一个GPU运行数千大模型成为可能

一般来说，大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是，当针对众多任务（如个性化助手）对 base 模型进行微调时，训练和服务成本会变得非常...

AI行业动态

1年前 (2023)

微软用GPT-4V解读视频，看懂电影还能讲给盲人听，1小时不是问题

差不多已经掌握语言能力的大模型正在进军视觉领域，但具有里程碑意义的 GPT-4V 也仍有诸多不足之处，参阅《试过 GPT-4V 后，微软写了个 166 页的测评报告，业...

AI行业动态

1年前 (2023)

Agent4Rec来了！大模型智能体构成推荐系统模拟器，模拟真实用户交互行为

一直以来，推荐系统领域面临模型线上线下效果差距大的痛点问题，昂贵的线上 A/B 测试成本使得广大研究人员望而却步，也造成学术界的推荐系统研究与工业界的实...

AI行业动态

1年前 (2023)

幻觉率直降40%，中国电信千亿参数「星辰大模型」炸场，业界首提缓解多轮幻觉解决方案

经历了 2023 年「百模大战」的洗礼，不管是国内还是海外，不管是开源还是闭源，各家大模型都从追赶和超越中获得了实质的进步。在语言、语音、视觉领域，大模...

AI行业动态

1年前 (2023)

最强AI芯片英伟达H200深夜发布，Llama2-70B推理提速90%，2024年二季度发货

芯片巨头英伟达，又打出一张王牌。英伟达在 2023 年全球超算大会（SC2023）上发布了目前世界上最强的 AI 芯片 H200。这款新的 GPU 基于 H100 进行了升级，内...

AI行业动态

1年前 (2023)

被OpenAI带火的Agent如何解放人力？清华等发布ProAgent

近日，来自清华大学的研究人员联合面壁智能、中国人民大学、MIT、CMU 等机构共同发布了新一代流程自动化范式 “智能体流程自动化” Agentic Process Automation...

AI行业动态

1年前 (2023)

可跨学科理解、多尺度建模，MIT LAMM发布微调的大语言模型 MechGPT

编辑 | 萝卜皮几个世纪以来，研究人员一直在寻找连接不同领域知识的方法。随着人工智能的出现，我们现在可以探索跨领域（例如，力学-生物学）或不同领域（例...

AI行业动态

1年前 (2023)

大模型幻觉率排行：GPT-4 3%最低，谷歌Palm竟然高达27.2%

排行榜一出，高下立见。人工智能发展进步神速，但问题频出。OpenAI 新出的 GPT 视觉 API 前脚让人感叹效果极好，后脚又因幻觉问题令人不禁吐槽。幻觉一直是大...

AI行业动态

1年前 (2023)

英伟达：B100将于明年推出 AI表现性能是H200两倍以上

为AI热潮再添动力英伟达发布新一代芯片H200，集成了141GB的内存，更加擅长进行“推理”。2024年推出的Blackwell架构B100 GPU，在GPT-3 175B推理性能标竿方面击...

AI行业动态

1年前 (2023)

比ChatGPT早发两周，被喷下线的Galactica成了LeCun最大的意难平

S-LoRA：一个GPU运行数千大模型成为可能

微软用GPT-4V解读视频，看懂电影还能讲给盲人听，1小时不是问题

Agent4Rec来了！大模型智能体构成推荐系统模拟器，模拟真实用户交互行为

幻觉率直降40%，中国电信千亿参数「星辰大模型」炸场，业界首提缓解多轮幻觉解决方案

最强AI芯片英伟达H200深夜发布，Llama2-70B推理提速90%，2024年二季度发货

被OpenAI带火的Agent如何解放人力？清华等发布ProAgent

可跨学科理解、多尺度建模，MIT LAMM发布微调的大语言模型 MechGPT

大模型幻觉率排行：GPT-4 3%最低，谷歌Palm竟然高达27.2%

英伟达：B100将于明年推出 AI表现性能是H200两倍以上

相关文章

热门标签