给大模型评分的基准靠谱吗?Anthropic来了次大评估

在大模型(LLM)盛行的当下,评估 AI 系统成为了重要的一环,在评估过程中都会遇到哪些困难,Anthropic 的一篇文章为我们揭开了答案。现阶段,大多数围绕人工...

178页,128个案例,GPT-4V医疗领域全面测评,离临床应用与实际决策尚有距离

上海交大&上海AI Lab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性能。在大型基础模型的推动下,人工智能的发展近来取得了巨大进步,...

懂幽默,嘲讽技能拉满,马斯克打造的ChatGPT竞品终于爆出了聊天截图

马斯克公司做出的聊天 AI 和他本人一样特立独行。最近,马斯克的传记 ——《埃隆・马斯克传》在国内外成了畅销书,书中记录了马斯克的成长和创业历程。这些经历...

AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后,有人破案了

没有「理解」,「创造」也就无从谈起。从 ChatGPT 到 GPT4,从 DALL・E 2/3 到 Midjourney,生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产...

两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速

模型小了,幻觉还减轻了。前段时间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似视频。这些视频很多都出自一个名叫「H...

大模型落地最后一公里:111页全面综述大模型评测

当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断向前发展。然而,尽管大模型...

国内首家!北京成立省级人形机器人创新中心 将打造全球首个“硬件母平台”

北京人形机器人创新中心有限公司在经开区机器人创新产业园正式注册,标志着国内首家省级人形机器人创新中心成立。该公司由机器人整机、核心零部件、大模型等...

马斯克旗下xAI发布首个AI大模型产品“Grok”叛逆风格独树一帜 数据优势成最大卖点

财联社11月5日电,马斯克旗下xAI团队发布其首个AI大模型产品——Grok。据介绍,Grok通过X平台实时了解世界,还能回答被大多数其他AI系统拒绝的辛辣问题。如果车...

中科院物理所等发布AI模型MatChat 用于预测无机材料合成路径

从中科院物理所获悉,近期,中国科学院物理研究所/北京凝聚态物理国家研究中心SF10组和中国科学院计算机网络信息中心共同合作,将AI大模型应用于材料科学领域。

研究人员演示骇人场景:AI机器人会进行内幕交易并掩盖真相

英国举行的首届全球人工智能安全峰会的一场演示中,一个AI机器人便利用编造的内幕信息瞒着公司“非法”购买了股票。当被问及它是否利用了内幕交易时,它还矢口...
1 90 91 92 93 94 196