能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

AI行业动态9个月前发布 ainavi
6,484 0

文本大模型卷出新高度,Claude 3 在数学、编程、多语言理解、视觉等多个维度超越 GPT-4 和上线不足一个月的 Gemini 1.0 Ultra。「日新月异」已经不足以形容当下大模型技术发展之势。

为了更好地分享大模型技术最新进展,2024 年,机器之心、张江科投、张江孵化器、WAIC Circle 联合发起举办「大模型技术 Workshop」系列活动,邀请产学研一线大咖带来前沿观察与洞见。

3 月 22 日下午,上海张江纳贤路 800 号科海大楼 A 座 3 层 ,以「Claude 3 热浪来袭,一起聊聊文本大模型的重点技术路径」为主题,来自复旦大学、波形智能、亚马逊云科技的学者和技术专家们将进行深入分享与交流。欢迎关注大模型进展的专业观众加入活动,一起交流探讨。

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

嘉宾介绍能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

演讲题目:大模型能力对齐

演讲嘉宾:桂韬,复旦大学自然语言处理实验室副研究员。研究领域为预训练模型、类人对齐和智能体交互。在高水平国际学术期刊和会议上发表了 50 余篇论文,主持国家自然科学基金、计算机学会、人工智能学会多个人才项目。曾获钱伟长中文信息处理科学技术奖一等奖、NeurIPS2023 大模型对齐 Track 最佳论文奖,COLING2018 最佳论文提名奖、NLPCC2019 杰出论文奖、CIPS 优博奖、ACM 优博奖,入选第七届“中国科协青年人才托举工程”、上海市启明星计划、世界人工智能大会云帆奖“璀璨明星”称号。

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

演讲题目:超长文本创意写作大模型的训练和推理方案

演讲嘉宾:周王春澍,波形智能 CTO。本科和硕士毕业于北航中法工程师学院,博士曾就读于 ETH Zurich,师从Ryan Cotterell & Mrinmaya Sachan。2023 年 4 月辍学并创立了波形智能(AIWaves),担任公司的 Cofounder & CTO。研究方向主要包括 LLM training & prompting, language agents, long/creative text generation, efficient methods for NLP, multi-modal LLMs, commonsense reasoning 等。曾于 2022 获得百度奖学金。曾在 MSRA/字节AI Lab/AI2 等机构实习,并在字节跳动 AI Lab 担任 research scientist。周王春澍在 NeurIPS/ICML/ICLR/ACL/EMNLP/NAACL 等机器学习自然语言处理会议中发表文章 30 余篇,同时担任这些会议的审稿人,以及 ARR/*ACL 的领域主席(Action Editor / Area Chair)。

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

演讲题目:Claude 3 技术解析与场景演示

演讲嘉宾:林业,亚马逊云科技资深解决方案架构师。擅长 C++/C#/Java/PHP/Python/JS 等多种开发语言,持续开发过一个 Github repo 从个位数🌟增加到 3000🌟。曾构建过支持 1000 万用户的共享单车 APP,参与开发多款知名车企 APP,并获得 2005 年浙江省 ACM 奖项,现专注于企业云原生架构与 GenAI 发展,并致力于将其能力应用于企业业务场景。

活动报名

此次「大模型技术 Workshop 第一期」报名已开启,扫描下图二维码或点击底部「阅读原文」可直达活动报名页。

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

关于本次活动的相关问题,欢迎添加机器之心小助手(ID:13661489516)或通过邮件(chenyinyi@jiqizhixin.com)进行咨询。

© 版权声明

关注公众号,免费获取chatgpt账号
免费获取chatgpt

相关文章

暂无评论

暂无评论...