百度沈抖:传统云计算不再是主角, 智能计算呼唤新一代「操作系统」

  • 2024-04-17

  • 来源:极客公园

4 月 16 日,Create 2024 百度 AI 开发者大会在深圳召开。期间, 百度集团执行副总裁、百度智能云事业群总裁沈抖正式发布新一代智能计算操作系统——万源, 通过对 AI 原生时代的智能计算平台进行抽象与封装设计, 为用户屏蔽掉云原生系统与异构算力的复杂性, 提升 AI 原生应用开发效率与体验。

沈抖表示, 随着大模型技术的不断演进, 通过自然语言进行编程正在成为现实。编程将不再面向过程或者面向对象, 而是面向需求;编程的过程将成为开发者表达愿望的过程, 并为操作系统带来革命性的变化。在操作系统的内核中, 底层硬件从以 CPU 算力为主变成以 GPU 算力为主, 并且新增了被大模型压缩的世界知识。操作系统管理的对象发生了本质的变化, 从管理进程、管理微服务, 进化为管理智能。

(百度集团执行副总裁、百度智能云事业群总裁沈抖)

「传统的云计算系统依然重要, 但不再是主角, 我们需要一个全新的操作系统, 对新的计算平台, 也就是智能计算做好抽象和封装, 重新定义人机交互, 为开发者提供更简单、更流畅的开发体验。」沈抖如是说。

(百度智能云发布新一代智能计算操作系统——万源)

本次大会上, 百度智能云全新推出的「万源」智能计算操作系统, 旨在「桥接」算力效能与应用创新。具体来讲, 万源主要由 Kernel(内核)、Shell(外壳)、Toolkit(工具) 三层构成, 底层屏蔽掉云原生系统与异构算力的复杂性, 上层则为 AI 原生应用的敏捷开发提供支撑与保障。

首先, 在内核层, 在算力资源管理方面, 百度百舸·AI 异构计算平台针对大模型训练、推理等任务, 对智算集群的设计、调度、容错等环节进行了专项优化。目前, 百舸能够实现万卡集群上的模型有效训练时长占比超过 98.8%, 线性加速比、带宽有效性分别高达 95%, 算力效能业界领先。

此外, 百舸还兼容昆仑芯、昇腾、海光 DCU、英伟达、英特尔等国内外主流 AI 芯片, 支持用户以最小代价完成算力适配。相比模型推理,「一云多芯」在模型训练场景中是极难攻坚的难题, 主要包含两类细分场景:

1、智算集群中存在多个训练任务, 单一厂商芯片只服务单一任务;

2、在每个独立的模型训练任务中同时使用不同厂商芯片。这就需要解决不同厂商芯片算力均匀切分、芯片间通信效率优化等问题, 难度极高。

(业界领先的单一任务一云多芯大模型训练解决方案)

目前, 百舸已经实现了单一训练任务下不同厂商芯片的混合训练, 且百卡规模性能损失不超过 3%, 千卡规模性能损失不超过 5%, 业界领先。最大程度上屏蔽硬件之间差异, 帮助用户摆脱单一芯片的依赖, 实现更优成本, 打造更具弹性的供应链体系。

万源内核中的另一个重要组成部分是大模型。大模型能够将巨量的世界知识进行高效压缩, 并将自然语言的理解、生成、逻辑、记忆能力进行封装。目前, 万源内核中既包含了业界领先的 ERNIE 4.0、ERNIE 3.5 大语言模型, 也包括 ERNIE Speed/Lite/Tiny 等轻量级模型、文心视觉大模型和各具特色的第三方大模型, 充分满足用户在不同业务场景下的多样化需求。

在内核层之上是 Shell 层, 通过百度智能云千帆 ModelBuilder 解决内核中模型的管理、调度、二次开发等问题, 屏蔽掉模型开发的复杂性, 帮助更多人只投入少量的数据、资源和精力, 就能快速精调出适合自己业务的模型。同时, 在实际应用中,ModelBuidler 提供的模型路由服务, 能够自动为不同难度的任务选择合适参数规模的模型, 给出平衡效果与成本的最优模型组合。经测算, 在模型效果基本持平的情况下, 模型路由平均降低推理成本多达 30%!

在 Shell 层之上, 千帆 AppBuilder 和 AgentBuilder 共同构成了工具层, 为开发者提供强大的 AI 原生应用开发能力。尤其是 AppBuilder 提供的工作流编排功能, 支持开发者使用预置的模板和组件, 轻松定制自己的业务流程, 还能够集成、扩建自己的特色组件, 在不同节点上选用适合的模型, 通过灵活的编排实现业务逻辑。

在 AppBuilder 上开发 AI 原生应用的过程中, 还可以直接调用通过 ModelBuilder 精调过的模型, 让整个开发过程变得极为流畅和便捷。在应用开发完成后, 可以一键发布到百度搜索、微信公众号等平台, 也可以通过 API 或 SDK 的方式直接集成到用户自己的系统中, 真正做到极速开发、轻松上市。

万源作为开放的操作系统, 未来还将进一步开放生态合作, 为应用开发者提供更多能力和接口;助力企业打造专属的垂直行业操作系统;将万源部署在客户自有智算中心, 提供稳定、安全、高效的智能计算平台服务;适配更多厂商异构芯片并发挥其最大效能。

当前, 大模型技术与 AI 原生应用正在促使云服务向以 AI 为核心的新一代智能计算操作系统方向发展, 这一趋势不仅反映了技术发展的内在逻辑, 也体现了市场需求的强劲推力, 并开启一个由 AI 驱动的崭新的智能云时代。

  • 推荐
  • 新闻
  • 观点
  • 制造
  • 批发零售
  • 房地产
  • 住宿餐饮
  • 金融
  • 银行
  • 保险
  • 证券
  • 基金
  • 交通物流
  • 能源化工
  • IT/互联网
  • 建筑
  • 农业
  • 教育
  • 医疗卫生
  • 采矿

推荐

我要评论