万万没想到,ChatGPT参数只有200亿?
这合理吗?谁都没有想到,ChatGPT 的核心秘密是由这种方式,被微软透露出来的。昨天晚上,很多讨论 AI 的微信群都被一篇 EMNLP 论文和其中的截图突然炸醒。微...
苹果M3系列登场,性能翻倍,M1、M2已成时代眼泪
M3 芯片来了。在苹果今天的 Scary Fast 发布会上,苹果正式发布了 M3、M3 Pro、M3 Max 芯片。苹果表示,这是首款采用 3 纳米工艺技术的 PC 芯片,允许将更多...
2023云栖大会开幕,阿里巴巴蔡崇信:打造AI时代最开放的云
蔡崇信表示,随着人工智能(AI)大模型技术的迅速发展,智能化时代正在开启,AI 将成为各行各业的新型生产力,并对算力提出更高要求。从底层算力到 AI 平台再...
图模型也要大?清华朱文武团队有这样一些观点
在大模型时代,图机器学习面临什么样的机遇和挑战?是否存在,并该如何发展图的大模型?针对这一问题,清华大学朱文武教授团队首次提出图大模型(Large Graph...
用童话训练AI模型,微软找到了探索生成模型参数的新切入点
即便大语言模型的参数规模日渐增长,其模型中的参数到底是如何发挥作用的还是让人难以琢磨,直接对大模型进行分析又费钱费力。针对这种情况,微软的两位研究...
苹果前员工研发无屏幕AI硬件产品:将于下个月发布 能够运行GPT-4
由两位离职的苹果员工共同创立的智能软件和消费设备研发商Humane,将于下个月发布其暗中研发了数年的首款产品Ai Pin,这款设备没有屏幕,这是一款“基于服装的...
机构:预估2023年高端AI服务器出货量将达17.2万台
研究机构DIGITIMES表示,由于封装HBM所需的CoWoS产能不足,因此2023年高端AI服务器需求与供给将有35%以上的落差,但预估全球高端AI服务器今年的出货量仍将增...
阿里云通义千问App上线安卓应用市场
近日,阿里云旗下大模型通义千问App上架各大安卓应用市场,版本号为1.0.2。应用介绍显示,通义千问是一款超大规模预训练模型,能够在创意文案、办公助理、学...
清华开发超高速光电计算芯片 算力达到目前高性能商用芯片的3000余倍
清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出了一种“挣脱”摩尔定律的全新计算架构:光电模拟芯片,算力...
苹果研究团队提出俄罗斯套娃式扩散模型MDM
上周,苹果研究团队提出俄罗斯套娃式扩散模型(Matryoshka Diffusion Models,MDM),用于端到端高分辨率图像生成。该研究提出的主要观点是将低分辨率扩散过...