AI中国 集成1500+工具
AI行业动态
看视频、画CAD、运动想像识别!75B的多模态工业大模型太能干了
今年升级的重点在于引入了多模态大模型能力。当 Sora 和 Suno 所创造的视频和音乐作品在全球范围内引起视听革命时,工业领域的大规模多模态应用又将如何演进...
霉霉说地道中文,口型、卡点几乎完美,网友:配音时代结束了?
「给电影配音的时代即将结束了。」AI 的发展让很多人直呼饭碗被抢了,以前是艺术家、程序员…… 现在配音员也要失业了?前有女歌星霉霉(泰勒・斯威夫特)大秀...
顶尖AI研究者,中国贡献26%:全球人才智库报告出炉
建设大学 AI 专业,大力投入产业发展,现在成效已逐渐显现。2019 年,《麻省理工科技评论》报道了一份关于中国人工智能人才库增长速度的报告。报告的主要发现...
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如雨后春笋般涌现,进一步丰富了...
今年,中国AI大模型产业发展看这些
现在的人工智能,已不是「可以用」,而是「非常好用」了。上个星期,谷歌与李世石一次久违的对话,唤起了人们的回忆:仔细想来,自 2016 年 AlphaGo 在围棋上...
46秒AI生成真人视频爆火,遭在线打假「换口型、声音」
是炒作还是真正的 AI 视频能力进化?AI 生成视频已经发展到这个程度了吗?前段时间,英国王室凯特王妃的 P 图事件,再次将人们的注意力吸引到了图像或视频造...
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
广阔的战场,风暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running...这段长达 1200 帧的 2 分钟视频来自一...
详解Latte:去年底上线的全球首个开源文生视频DiT
随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化...
通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧AI智能体
3月28日,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线流畅运行即时且精准的多轮AI对话应用...
将大模型能力融入 7 大产品,百度智能云交出「企业大模型应用成绩单」
数字人带货仅需真人 15% 的成本,获得 85% 的 GMV;过去说两句就找人工客服的用户,如今 90% 的问题已经通过智能客服自助解决;面对霸道老板的灵魂发问,一句...