测试分类 | AI中国

对标OpenAI事实性测试，这份中文评测集让o1-preview刚及格

如何解决模型生成幻觉一直是人工智能（AI）领域的一个悬而未解的问题。为了测量语言模型的事实正确性，近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集...

AI行业动态

3个月前

ChatGPT

AI行业动态

2年前 (2023)

1. 用 ChatGPT 替代搜索引擎工作时，你一天会访问几次搜索引擎？有了 ChatGPT，使用搜索引擎的频率可能大大下降。据报道，谷歌这样的搜索引擎巨头，实际上...

AI行业动态

2年前 (2023)

马斯克在接受福克斯新闻采访时，才首度公开了TruthGPT——一个更安全、更透明的类ChatGPT应用，目的是对OpenAI的路线予以修正，尝试创造OpenAI和谷歌以外的“第...

AI行业动态

2年前 (2023)

GPT-4太强，甚至已经化身“主考官”了！给其他市面上主流的大模型打分，结果自己给了自己最高分： 95.5。（好，给自己留点努力的空间）不过随后就没有上90...

AI行业动态

2年前 (2023)

大规模运算的使用的管控，安全标准，和部署 AI 后的监管以及经验分享是非常好的注意

AI行业动态

2年前 (2023)

AutoGPT 肯定会随时间推移而愈加完善

AI行业动态

2年前 (2023)

自从ChatGPT出现之后，各种大语言模型是彻底被解封了，每天见到的模型都能不重样，几乎分不清这些模型是哪个机构发布的、有什么功能特点、以及这些模型的关系...

AI行业动态

2年前 (2023)