据华为RL(强化学习)团队负责人Haitham Bou Ammar于社交平台X发文,来自华为诺亚方舟实验室、伦敦大学学院(UCL)、牛津大学的团队于23日发表论文,提出了一种通用框架模型盘古Agent,用于将结构化推理整合到AI Agents的政策中并进行学习。据介绍,该框架利用内在和外在函数的构建,增加了对推理结构的理解,还提供了在每个模块或功能内部学习模型的自适应能力。 论文地址:arxiv.org/abs/2312.14878
© 版权声明
文章版权归作者所有,未经允许请勿转载。
关注公众号,免费获取chatgpt账号
相关文章
暂无评论...