大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」
将不同的基模型象征为不同品种的狗,其中相同的「狗形指纹」表明它们源自同一个基模型。大模型的预训练需要耗费巨量的计算资源和数据,因而预训练模型的参数...
2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源
千元机也能本地运行。在大模型不断向着大体量方向前进的同时,最近一段时间,人们在优化和部署方面也取得了成果。2 月 1 日,面壁智能联合清华 NLP 实验室在...
代谢数据集上四项指标达94%~98%,西南交大团队开发多尺度图神经网络框架,助力药物研发
作者 | 刘悦睿编辑 | 红菜苔药物研发过程中,了解分子与代谢路径之间的关系,对于合成新分子和优化药物代谢机制至关重要。西南交通大学杨燕/江永全团队开发了...
蚂蚁集团NextEvo全面开源AI Infra技术,可实现大模型训练“自动驾驶”
近日,蚂蚁集团AI创新研发部门NextEvo全面开源AI Infra技术,可帮助大模型千卡训练有效时间占比超过95%,能实现训练时“自动驾驶”,这推动了AI研发效率。图:...
“千帆杯”第一期赛题公布!一起探索 AI 原生应用的时间魔法
提到“春节”,你首先会想到什么?热气腾腾的年夜饭,大门前福气满满的春联,摩肩接踵的车站,还是一眼看不到排队尽头的游玩景点?不知从什么时候起,各大主题...
亚马逊部署超过750,000+ 台机器人,工业创新基金投资生成式AI
机器之能报道编辑:吴昕亚马逊工业创新基金有了新趋势。新负责人表示进一步支持生成式 AI,他们甚至投资了一家未公开的生成式 AI 初创公司,称该公司的技术可...
小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜
只需一张照片,整个过程无需训练 LoRA 模型,多风格 AI 写真即刻呈现!最近,有一群来自小红书的 95 后神秘团队,自称 InstantX,搞了个大动作 —— 开源「Inst...
刚刚,字节版GPTs「扣子」上线了
大玩家终于正式下场。在持续一年的大模型热潮之后,「智能体」成为了科技公司们新的押注方向之一。近日,字节跳动正式推出「Coze 扣子」AI Bot 开发平台。任...
赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了
去年 4 月,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA(Large Language and Vision Assistant)。尽管 LLaVA 是用一个小的多...
无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍
Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7...