大语言模型,vivo 也做到了几个「业内第一」。
国内头部手机厂商,最近正在集中发布通用大模型和自研操作系统,而 vivo 正在把两者高度融合在一起。
11 月 1 日,vivo 在 2023 开发者大会上正式发布了自研 AI 大模型「蓝心 BlueLM」和全平台自研操作系统「蓝河 BlueOS」。与此同时,最新一代手机系统 OriginOS 4 也进行了正式亮相。
「经过多年的准备,今天 vivo 发布自研大模型矩阵,其中也包含手机行业内的首个开源大模型。」vivo 高级副总裁、首席技术官施玉坚说道。「我们的自研大模型可以把新的用户体验带到每个用户手中,它可以完成各种你想做的事情。」
昨天 vivo 正式发布的自研蓝心大模型 BlueLM 经历了六年研究,覆盖了十亿、百亿、千亿三个参数量级,全面覆盖了目前应用的核心场景。
在这其中,10 亿量级模型是主要面向端侧场景打造的专业文本大模型,在手机上进行推理的速度可达 64 字 / 秒,具备本地化的文本总结、摘要等能力。70 亿模型是面向手机打造的端云两用模型,具有优秀的语言理解、文本创作能力。
同时,上述两个量级的模型支持高通和联发科(MTK)最新旗舰平台(也就是骁龙 8Gen3 和天玑 9300)的端侧化部署,在保证数据安全的同时,在 token 输出速度、响应时间、内存占用等方面也非常优秀。
除了面向端侧的模型,vivo 在更大体量的模型上也做到了较好的效果。蓝心大模型 70B 是面向云端服务的主力模型,用于角色扮演、知识问答等任务,其综合能力,在 C-Eval、CMMLU、SuperCLUE(10 月)等榜单中均处于中文大模型的第一梯队。另外,vivo 提供的 1300 亿、1750 亿参数大模型将在更为复杂的场景,如逻辑推理、任务编排中为用户带来更专业的体验。
什么样的大模型才能在今天的「百模大战」中脱颖而出?vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围认为,真正优秀的大模型需要五个特点:
-
首先是模型规模足够大,支持模态要全,这样才能让人工智能具备人类的很多能力。
-
其次是算法强,要在基础算法上不断突破,在评测榜单中领先。
-
第三是安全性,要保证大模型的价值观、道德规范符合要求,同时保证数据和隐私安全。此外还要不断提升模型训练的数据安全,提升抗攻击能力。
-
第四是自我进化能力,大模型需要不断更新数据以提升能力,适应用户的需求。
-
最后是开源开放,vivo 希望降低模型应用的门槛和成本,推动整个产业的共同进步。
据介绍,为了构建自有大模型体系,vivo 组建了千人规模的 AI 专家团队,自 2018 年成立人工智能图谱研究院以来,已经积累了 13000T 的多种模态数据以及 2800T 高质量中文文本数据。其工程师不断从多维度入手持续丰富训练数据,强化算法,同时通过信息技术应用创新去解决算力问题并不断提升技术安全能力。
在大会现场,vivo 还表示刚刚在工程上实现了 13B 参数大模型在手机 SoC 上的完整跑通。可以预见,随着移动端算力提升和模型的不断优化,我们很快就会拥有更加强大的移动版通用 AI。
基于开源的大模型和 API 工具,vivo 推出了蓝心大模型开发套件 Bluekit,中小开发者可以直接调用大模型的端侧推理能力,真正实现了大模型的开箱即用。另一方面,对于希望进行微调的开发者,vivo 提供模型参数热插拔机制,通过系统级计算调度,将开发者模型进行组合推理,帮助构建高自由度的定制化模型。
蓝心大模型在 vivo 的生态中已经有了两种应用,首先是类似于 ChatGPT 应用的自然语言对话 APP「蓝心千询」:
和目前我们能看到的很多大模型应用一样,蓝心千询不仅可以与你进行自然对话,搜索整合知识,还可以进行文学创作、图片生成,甚至还能编写程序。
在现场,vivo 着重展示了代码生成的能力。「即使是编写量化框架这样的复杂任务,用蓝心千询来写,你只需要提出需求,大模型 30 秒就能搞定,」周围说道。「它也可以用来写 Python 界面、写算法、写表格、处理数据库。以后写代码,不用动手,开口即可。」
vivo 表示,蓝心千询将登录应用市场,vivo 品牌以外的手机也将可以使用这款 APP。
还有融合在 OriginOS 4 系统里的首款全局智能助理蓝心小 V。在大模型的加持下,这个智能助理拥有行业领先的智慧,它可以通过语音、文字、文件拖拽等方式接收信息进行处理。如果遇到简单的问题,小 V 会以文字或图片进行回复。面对复杂的问题,它还可以通过 SWOT 模型或思维导图的形式输出回答。
比如手机上刚收到一个英文的论文,想让 AI 帮你写个摘要,只需要在小 V 的对话框里写:总结一下刚接收到文件的内容,保存到原子笔记里。
只用几秒钟的时间,你就可以快速地了解论文的主要内容了。
蓝心小 V 还可以帮助你整理复杂内容的逻辑,生成企划,构建日程等等。当然,目前生成式 AI 主打的生成图片、知识问答等能力它也都有。
有了相比以往更强的 AI 算法,vivo 的新一代系统会是什么样子?在开发者大会上,OriginOS 4 正式亮相,新一代系统在在设计、场景应用、AI 能力、系统底层等方面进行了很多升级。
为了解决用户的部分痛点场景,OriginOS 4 带来了全链路解决方案。例如专门针对地下停车场的定位进行优化,新增了停车助手等功能,让用户在停车、寻车、离库等场景下拥有更优的体验。
针对办公场景,OriginOS 4 打造了全链路会议助手,可以在你开在线会议的时候,实时以文字方式进行会议内容速记,并自动添加你截好的图片。任何安装 vivo 办公套件的电脑都可以自动连接手机,互相分享文件,也可以搜索手机中的内容。
此外,OriginOS 4 还升级了超级省电、AI 离线翻译等实用功能。
在系统性能的优化上,OriginOS 4 的改进包括通过「虚拟显卡」实现更快的应用程序响应。它将应用程序的打开和关闭时间减少了 36%,并将帧速率稳定性提高了 70%。对于多任务算力的分配也有了进一步优化,操作系统会优先分配 CPU 和 GPU 资源处理屏幕上的任务,并阻止「不相关的计算」。
最近,国内头部厂商正在比拼自研系统。vivo 打造的自主研发的全新智慧操作系统 —— 蓝河操作系统 BlueOS 也在昨天首次亮相。
蓝河操作系统从底层引入了蓝心 AI 大模型能力,支持复杂的意图识别和交互方式,既为用户提供了声音、图片、手势等自由交互方式,也为开发者提供了自动编写代码等应用开发新范式。
「BlueOS 可以了解你的需求,自动生成代码,生成专属于你的桌面主题、壁纸和挂件。随着大模型能力的增强,我们都可以在其中进行创作,人人都可以成为软件工程师和 UI 工程师。」周围表示。
vivo 表示,蓝河操作系统没有安卓的虚拟机层,作为一个标准的操作系统,兼容不同的硬件体系结构。通过内核抽象层实现了对不同内核兼容,蓝河是符合 Posix 标准的操作系统,支持 Linux 内核,RTOS 内核。它结合了先进的 AI 大模型,从系统、应用,到工具链进行了全新的设计,会接入蓝心大模型的多模态能力。
蓝河不只是面向手机的系统,它可以运行在 CPU 频率 200MHz,内存 32MB 的可穿戴设备上。第一个搭载此系统的是智能手表 vivo Watch 3,它将在本月面世。
由于是 Linux/RTOS 为底层的自研架构,因此 BlueOS 不兼容安卓应用。目前支付宝、百度地图、喜马拉雅等应用已为蓝河开发了定制版的应用。蓝河生态为开发者提供了蓝河开发套件,包括蓝河 SDK 和蓝河 Studio,为开发者提供了开发套件支持。
另外有趣的是,蓝河操作系统是行业首个系统框架由 Rust 语言编写的操作系统,在根本上解决了内存使用不当引起的安全漏洞问题。
有了包括大模型的 AI 技术、自研操作系统和新一代硬件,vivo 迈出了大模型时代移动交互的重要一步,将实现「1+2+N」的智能系统体验。
在这其中:1 是指 vivo 自研的通用大模型矩阵 —— 蓝心大模型 BlueLM;2 是指系统全局智能辅助应用「蓝心小 V」和以公版 APP 形式推出的自然语言对话机器人「蓝心千询」;N 则是指开发者依托 vivo 70 亿蓝心大模型及其微调框架、大模型开发套件 BlueKit 打造的高效、低成本专属大模型。
正如主 Keynote 所提到的,目前想要在端侧运行大模型,我们需要使用最新一代旗舰级芯片的手机。在昨天开发者大会的展台上,iQOO 12 真机已被提前曝光了。这款手机搭载骁龙 8Gen3,16+16G 内存,还有自研电竞芯片 Q1。
我们期待大模型在新一代移动设备上的表现。