您的位置:首页 >综合资讯 >正文

Lenovo SR675 V3和英伟达L40S GPU帮助驱动下一代人工智能系统

摘要 由 NVIDIA 全新 L40S GPU 提供支持的 Lenovo ThinkSystem SR675 V3 服务器登上了洛杉矶 SIGGRAPH 的舞台,成为 NVIDIA 计划...

由 NVIDIA 全新 L40S GPU 提供支持的 Lenovo ThinkSystem SR675 V3 服务器登上了洛杉矶 SIGGRAPH 的舞台,成为 NVIDIA 计划推进全球 AI 推广并引入智能聊天机器人、搜索和摘要工具等生成式 AI 应用程序的焦点。各行业的用户。

新的 ThinkSystem 作为 NVIDIA OVX 服务器进行展示,并将很快集成最近发布的 NVIDIA L40S GPU。此次合作预计将有助于彻底改变人工智能的实施,实现下一代人工智能、沉浸式元宇宙模拟和大规模的认知决策。

NVIDIA L40S GPU

新推出的 NVIDIA L40S GPU 是一款功能强大的通用数据中心处理器,专为加速计算密集型应用而设计,包括人工智能训练和推理、3D 设计和可视化、视频处理以及使用 NVIDIA Omniverse 平台的工业数字化。它拥有针对大型语言模型 (LLM) 推理和再训练、图形和视频应用程序的突破性多工作负载加速。

L40S GPU 为下一代支持 AI 的音频、语音、2D、视频和 3D 应用程序提供支持,是即将推出的 NVIDIA Omniverse OVX 3.0 平台的关键组件,可提供高保真度和准确的数字孪生。

NVIDIA L40S GPU

NVIDIA L40S GPU 将成为 NVIDIA OVX 系统的关键资产。每台服务器均采用 NVIDIA Ada Lovelace GPU 架构和 48GB 内存,最多可容纳 8 个 L40S GPU。它还拥有第四代 Tensor Core 和 FP8 Tranormer Engine,提供惊人的 1.45 petaflops 张量处理能力。

与前身 NVIDIA A100 Tensor Core GPU 相比,L40S 的生成式 AI 推理性能提高了 1.2 倍,训练性能提高了 1.7 倍,可处理具有数十亿个参数和多种数据模式的复杂 AI 工作负载。

L40S GPU 旨在满足各种专业工作流程。它包含 142 个第三代 RT 核心,可提供 212 teraflops 的光线追踪性能,非常适合实时渲染、产品设计和 3D 内容创建等高保真专业可视化工作流程。

此外,L40S 的 18,176 个 CUDA 内核提供的单精度浮点 (FP32) 性能是 NVIDIA A100 GPU 的近 5 倍,确保以更高的效率满足工程和科学模拟的计算需求。

ThinkSystem SR675 V3 配置

联想的战略定位是通过针对新 GPU 进行优化的新服务器系列来支持 L40S。通过将完全模拟的数字孪生与生成式人工智能相结合,联想旨在改进其业务流程和设计成果。联想与 NVIDIA 在 NVIDIA OVX 系统上的合作促进了虚拟世界的构建和运营,将系统的功能扩展到生成式 AI,并为具有 AI 工作负载的数据中心提供强大的性能。

ThinkSystem SR675 V3 提供三种服务器配置合二为一,其中包括对具有 NVLink 和 Lenovo Neptune 混合液体冷却功能的 NVIDIA HGX A100 4-GPU 系统的支持。此外,它还兼容 4 或 8 个 GPU 配置,这些配置在 3U 空间内配备 NVIDIA L40S、NVIDIA H100 80GB 或 NVIDIA H100 NVL 服务器。

联想认为这些发展是简化人工智能部署的重大飞跃,使各种规模的组织都可以使用它,并推动所有行业的变革性智能。

ThinkSystem SR675 V3 配置:基础模块、密集模块和 HGX 模块

在 AI/HPC 服务器配置领域,了解不同配置的权衡和优势对于优化和特定工作负载要求至关重要。Lenovo ThinkSystem SR675 V3 的 Base、Dense 和 HGX 模块配置具有灵活性,每种模块配置均针对特定需求而设计。

基本模块

基本模块配置可满足寻求 GPU 支持和存储功能平衡组合的组织的需求。最多可容纳4个双宽、全高、全长;FHFL GPU,利用 PCIe Gen5 x16 连接。这为人工智能和深度学习工作负载提供了良好的并行处理能力。

存储方面,基本模块支持多达 8 个 2.5 英寸热插拔 SAS/SATA/NVMe 驱动器,在存储容量和速度之间提供平衡。

密集模块

对于优先考虑并行 GPU 处理的组织,密集模块可以支持多达 8 个双宽、全高、全长 GPU。每个 GPU 在 PCIe 交换机上使用 PCIe Gen5 x16,从而最大限度地增加单个服务器上的 GPU 数量,以增强并行处理能力。

在存储方面,密集模块具有多种用途。它支持最多 6 个 EDSFF E1.S NVMe SSD 或最多 4 个 EDSFF E3.S 1T NVMe HS SSD。此配置非常适合密集数据处理任务需要更多 GPU 但牺牲一定存储灵活性的场景。

HGX模块

HGX 模块配置是专门的,针对具有特定 GPU 要求的高性能需求。它利用 NVIDIA HGX H100 和 4 个 NVLink 连接的 SXM5 GPU。这些 SXM5 GPU 可能会限制机箱中可安装的总数,但它们提供卓越的芯片性能,使其成为要求苛刻的 AI 和深度学习任务的理想选择。

在存储方面,HGX 模块针对速度进行了优化。它最多可容纳 4 个 2.5 英寸热插拔 NVMe SSD 或最多 4 个 EDSFF E3.S 1T NVMe HS SSD。

结束语

ThinkSystem SR675 V3的每个模块配置都有其独特的优势。虽然 HGX 模块中的 SXM5 GPU 提供无与伦比的性能,但需要更多并行处理的组织可以选择密集模块来容纳更多 PCIe GPU。然而,这是以 TDP 损失和潜在性能下降为代价的。基本模块提供了一个中间立场,提供 GPU 支持和存储选项的平衡。与往常一样,最佳选择取决于手头任务的具体要求和限制,我们永远不会将这些配置中的任何一个踢出我们的实验室。

版权声明:本文由用户上传,如有侵权请联系删除!