系统极客一直在努力
专注操作系统及软件使用技能

顶级硬件,赋能 AI 创新:Nvidia DGX 和 HGX 平台的优势和特点

Nvidia

在 AI 领域,Nvidia 混得是如鱼得水,预计在未来几年内将继续领跑 AI 硬件市场。其企业级解决方案,搭载 H100 和 H200 「Hopper」CPU 和最新的 B100 和 B200「Blackwell」GPU,已经成为高性能计算(HPC)领域的热门选择。

DGX 系列,是一体化的 AI HPC 解决方案,专为追求极致性能的企业设计,适用于深度学习、生成式 AI 和数据分析等高强度任务。而 HGX 平台,同样基于顶尖的 GPU 技术,但提供了更高的定制性和灵活性,可以满足企业对 AI HPC 系统控制权和自由度的需求。

Nvidia DGX:引领超级计算的先锋

Nvidia DGX
Nvidia DGX

Nvidia 正逐步将业务重心从面向消费者的 GeForce 系列游戏 GPU,转向更具前景的企业和数据中心产品,以及专注于 AI 的工作站 GPU,同时游戏 GPU 业务仍然是其核心战略之一。这一转变顺应了行业发展的趋势。虽然 Nvidia 在游戏 GPU 市场依然占据领先地位,但在企业级市场的成功,才是推动其增长的关键因素。

Nvidia DGX 可整合高达 8 个 Tensor Core GPU 及配套的 AI 软件,致力于提升计算速度,推动 AI 应用的创新发展。该平台的核心是一个机架式机箱,内置 4 或 8 个通过 NVLink 技术互联的 GPU、高性能 x86 CPU 和 Nvidia 高速网络硬件。单套 DGX B200 系统就能提供高达 72 petaFLOPS 的训练性能和 144 petaFLOPS 的推理性能。

目前,Nvidia 提供了基于 Hopper 架构的 DGX H100 和基于 Blackwell 架构的 DGX B200 系统,专为 AI 工作负载进行了特别优化。对于追求更高性能的客户,Nvidia 还推出了 DGX SuperPOD,它集成了 36 个液冷的 Nvidia GB200 Grace Blackwell Superchips,包括 36 个 Nvidia Grace CPU 和 72 个 Blackwell GPU。这一强大硬件组合通过 Nvidia Quantum InfiniBand 技术连接的机架,让企业能够扩展计算能力至数千个 GB200 Superchips。

自 2016 年推出首款 DGX Server-1 以来,Nvidia 一直在推动企业级 HPC 业务的创新。从 Pascal、Volta 到 Ampere、Hopper 和 Blackwell,Nvidia 的企业级 HPC 业务不断推陈出新,引领技术创新,并在此基础上推出了可定制的 Nvidia HGX 平台。

Nvidia HGX:打造企业专属的超级计算力量

Nvidia HGX
Nvidia HGX

对于追求定制化超级计算解决方案的原始设备制造商(OEM)来说,Nvidia HGX 平台提供了与基于 Hopper 和 Blackwell 架构的 DGX 系统相媲美的高性能,还允许根据自身需求进行深度 OEM 定制。

客户可以根据自己的特定需求,自由选择和调整 CPU、RAM、存储和网络配置,从而打造出真正符合自身业务需求的超级计算机。实际上,Nvidia HGX 是构成 Nvidia DGX 系统的基础组件,同时它也遵循 Nvidia 设定的严格标准,确保了性能和质量。

Nvidia HGX 平台提供了 x4 和 x8 GPU 配置选项,而最新的基于 Blackwell 架构的基板则仅支持 x8 配置。HGX B200 系统的性能可高达 144 petaFLOPS,这不仅极大地增强了企业的 AI 和 HPC 计算能力,也为 OEM 提供了打造可扩展解决方案的可能性。

Nvidia DGX 与 HGX 对比

简易性与灵活性的权衡

Nvidia Data Center
Nvidia Data Center

Nvidia DGX 和 HGX 平台各自代表了企业级 AI 硬件解决方案的两个不同方面:简易性和灵活性。

  • Nvidia DGX:提供了一站式的解决方案,强调的是简易性和便捷性。DGX 系统为需要快速部署和高效运行 AI 应用的大型企业设计。通过整合的硬件和软件,用户可以轻松地搭建起强大的 AI 计算环境。此外,通过 DGX SuperPOD 等集群解决方案,企业能够构建庞大的数据中心,以满足大规模的计算需求。
  • Nvidia HGX:与 DGX 的集成性相比,HGX 平台更注重灵活性和定制化。它为 OEM 厂商提供了一个高度可定制的硬件平台,使他们能够根据客户的特定需求来调整和优化系统配置。这种模块化的方法为不同行业和应用场景提供了更多的选择和可能性。

AI 硬件市场的新篇章

Nvidia 在 AI 硬件市场的地位无疑是领先的,但市场环境也在不断变化。随着其他科技巨头如 Google、Intel 和高通等加入竞争,Nvidia 可能面临新的挑战。

这些公司作为 UXL 基金会的成员,正在共同开发「OneAPI」跨平台软件和工具,旨在减少对单一硬件供应商的依赖,促进 AI 应用在不同硬件上的兼容性和可移植性。

尽管如此,Nvidia 也在不断地进行自我革新和适应市场的变化。例如,通过推出 Chat with RTX 等新的软件应用,Nvidia 正在寻找硬件产品的新用途和增长点。这表明 Nvidia 不仅在硬件领域保持创新,同时也在软件和应用层面寻求突破。


总的来说,Nvidia DGX 和 HGX 平台各有优势,分别满足了市场上对简易性和灵活性的不同需求。而在 AI 硬件市场的竞争中,Nvidia 通过不断的技术创新和适应市场变化,保持了其领导地位。未来,随着更多企业的加入和新技术的发展,AI 硬件市场将更加多元和充满活力。

赞(0) 赞赏

评论 抢沙发

微信赞赏