致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

不得不说,Llama 2 的「二创」项目越来越硬核、有趣了。自 Meta 发布开源大模型 Llama 2 以来,围绕着该模型的「二创」项目便多了起来。此前 7 月,特斯拉前 ...

OpenAI计划研发自己的AI芯片,已有收购目标

天下苦英伟达久矣。微软和 OpenAI 这对合作伙伴,将在人工智能芯片赛道上成为竞争对手。据路透社报道,OpenAI 正在考虑构建自己的人工智能芯片来为 ChatGPT ...

基于牛顿求根法,新算法实现并行训练和评估RNN,带来超10倍增速

人们普遍认为 RNN 是无法并行化的,因为其本质上的序列特性:其状态依赖于前一状态。这使得人们难以用长序列来训练 RNN。近日,一种新算法的出现打破了这一惯...

76页综述+300余篇参考文献,天大团队全面介绍大语言模型对齐技术

天大自然语言处理团队从更广泛的 AI 对齐视角,审视大语言模型对齐技术,并从多个角度进行深入讨论。近日,天津大学熊德意教授团队发布了大语言模型对齐技术...

只动手不动口,或只动口不动手,你真能做到吗?

你是否注意过自己动手聚精会神做事情时会不自觉的伸出舌头,又或者一些歌手经常会在唱歌的时候,手也会不自觉的在空中舞动,手和舌头之间联动的秘密是什么?...

在笔记本电脑上从头设计一款会走路的机器人,AI只需26秒

受自然界进化设计的启发,使用进化算法的机器人自动化设计已经尝试了二十年,但效率仍然低下。现在,从一块肥皂状物质到成功步行的机器人,AI 的整个设计过程...

制作莫比乌斯环,最少需要多长纸带?50年来的谜题被解开了

自己动手做过莫比乌斯带吗?莫比乌斯带是一种奇特的数学结构。要构造一个这样美丽的单面曲面其实非常简单,即使是小孩子也可以轻松完成。你只需要取一张纸带...

LLM成功不可或缺的基石:RLHF及其替代技术

关于训练大模型常用的 RLHF 技术,这篇文章帮你逐步解读了其工作过程,还总结了一些其他替代方法。在讨论 LLM 时,我们总是会涉及一个名为「使用人类反馈的强...

如何降低视觉Transformer计算成本?时间冗余方法让人大吃一惊

在为语言领域带来变革之后,Transformer 正在进军视觉领域,但其也有着高计算成本的问题。近日,威斯康星大学麦迪逊分校一个研究团队提出了 Eventful Transfo...

最多400万token上下文、推理提速22倍,StreamingLLM火了,已获GitHub 2.5K星

如果你体验过与任何一款对话式 AI 机器人的交流,你一定能想起某些极具「挫败感」的时刻。比如,你在前一天的对话中讲述过的要点,被 AI 忘得干干净净……这是...
1 121 122 123 124 125 196