LLM成功不可或缺的基石:RLHF及其替代技术
关于训练大模型常用的 RLHF 技术,这篇文章帮你逐步解读了其工作过程,还总结了一些其他替代方法。在讨论 LLM 时,我们总是会涉及一个名为「使用人类反馈的强...
如何降低视觉Transformer计算成本?时间冗余方法让人大吃一惊
在为语言领域带来变革之后,Transformer 正在进军视觉领域,但其也有着高计算成本的问题。近日,威斯康星大学麦迪逊分校一个研究团队提出了 Eventful Transfo...
最多400万token上下文、推理提速22倍,StreamingLLM火了,已获GitHub 2.5K星
如果你体验过与任何一款对话式 AI 机器人的交流,你一定能想起某些极具「挫败感」的时刻。比如,你在前一天的对话中讲述过的要点,被 AI 忘得干干净净……这是...
ControlNet、「分割一切」等热门论文获奖,ICCV 2023论文奖项公布
从 ControlNet 到 SAM,今年大热的几篇 CV 论文摘得了本次 ICCV 大奖。本周,国际计算机视觉大会 ICCV(International Conference on Computer Vision)在法...
亚马逊刚投40亿美元,谷歌等又要投20亿,Anthropic 估值狂飙
为挑战OpenAI,Anthropic 遵循了与对手类似的道路。据科技新闻网站 The Information 报道,在宣布亚马逊高达 40 亿美元的新投资后不久,人工智能初创公司 Ant...
斯坦福NLP课程XCS224U视频全部放出,干货满满,速来听讲
50 个视频任君学习!从对话智能体到搜索查询,自然语言理解(NLP)是当今许多最令人兴奋的技术的基础。如何建立这些模型来高效、可靠地理解语言?如果你还没...
美媒:微软将于下个月推出其首款人工智能芯片
一位知情人士透露,微软计划在下个月的年度开发者大会上推出该公司首款为人工智能设计的芯片。微软的这款芯片是为训练和运行大型语言模型(LLM)的数据中心服...
外骨骼技术公司“程天科技”获Pappas Capital投资
外骨骼技术公司“程天科技”近日完成新一轮融资,由国际风险投资公司Pappas Capital投资,老股东余杭国投继续加注。本轮融资完成后,程天科技将在全球范围引入...
论文投Nature先问问GPT-4!斯坦福实测5000篇 一半意见跟人类评审没差别
GPT-4有能力做论文评审吗?来自斯坦福等大学的研究人员还真测试了一把。他们丢给GPT-4数千篇来自Nature、ICLR等顶会的文章,让它生成评审意见(包括修改建议...
消息人士:OpenAI正在探索自研AI芯片,以解决昂贵芯片短缺的问题
消息人士透露,OpenAI正在探索制造自研人工智能芯片,并已开始评估潜在的收购目标。至少从去年开始,该公司就讨论了各种方案,以解决其所依赖的昂贵AI芯片短...