智东西消息,阿里巴巴天猫精灵和通义大模型团队联合提出了面向中文大模型的价值观评估基准CVALUES,以衡量大语言模型在安全和责任标准方面的对齐能力。该团队共评测了十多个大模型,研究结果表明,虽然大多数中国大模型在安全性方面表现良好,但在责任方面仍有相当大的改进空间。
此外,该团队推出了大语言模型治理开源中文数据集100PoisonMpts 。据称,该项目提供了业内首个大语言模型治理开源中文数据集,十多位知名专家学者成为了首批AI标注工程师。标注人各提出100个诱导偏见、歧视回答的刁钻问题,并对大模型的回答进行标注。
论文链接:
http://xdp-expriment.oss-cn-zhangjiakou.aliyuncs.com/shanqi.xgh/release_github/CValues.pdf
项目地址:
https://github.com/X-PLUG/CValues
魔搭地址:
https://modelscope.cn/datasets/damo/100PoisonMpts/summary
© 版权声明
文章版权归作者所有,未经允许请勿转载。
关注公众号,免费获取chatgpt账号
相关文章
暂无评论...