英特尔推出了人工智能加速的第五代英特尔至强处理器系列,将通用计算的平均性能提高了 21%,并将一系列客户工作负载的平均每瓦性能提高了 36%,包括人工智能、高性能计算 (HPC) 、网络、存储、数据库和安全性,与上一代相比。英特尔表示,客户可以通过从老一代产品进行升级来降低高达 77% 的总拥有成本。
专为数据中心、云、网络和边缘而设计,第五代 Xeon 处理器 (代号为 Emerald Rapids)支持高达每个 CPU 64 个核心,末级缓存最大值是上一代的近 3 倍。它们为每个 CPU 提供 8 个 DDR5 通道,支持高达每秒 5,600 兆传输 (MT/s) 的 DDR5,并通过 Intel UPI 2.0 增加插槽间带宽,提供高达每秒 20 兆传输 (GT/s)。它们与上一代产品引脚兼容。
英特尔执行副总裁兼数据中心和人工智能事业部总经理 Sandra Rivera 表示:“十多年前,英特尔开始将人工智能加速构建到我们的至强处理器中,如今至强已成为支持人工智能工作流程的行业标准。”
在 4th Gen Xeon 中,英特尔集成了其高级矩阵扩展,可将 AI 性能提升高达 10 倍。 Rivera 表示,大多数全球领先公司都采用了第四代 Gen Xeon 来加速其人工智能,其中包括所有排名前 10 的超大规模企业。它也被云服务提供商采用。
Xeon 据称是唯一具有内置 AI 加速功能的主流数据中心处理器,全新第五代 Xeon 在多达 200 亿个参数的模型上提供高达 42% 的推理和微调能力。
Rivera 表示:“这是我们推出的最节能、最高性能和安全性最高的至强处理器,与上一代产品相比,平均性能提高了 21%。” “隐私和数据控制至关重要,第五代至强通过信任域扩展(英特尔 TDX)提供了更高的机密性和安全性,所有 OEM 和 CSP 解决方案提供商都将普遍使用它。”
Rivera 表示,此外,该处理器的每一个 64 个核心都内置了 AI 加速器,与上一代相比,用户的推理性能提高了 42%。 “这意味着企业可以轻松且经济高效地使用 CPU 来运行最新的生成式 AI 模型,例如 GPT-J、Dolly 和 LLaMA。”
她补充说,在云端,人工智能驱动的自然语言处理应用程序的运行速度将提高 23%,而边缘对象的分类速度将提高 24%。
该活动还突出了一些客户的胜利。例如,IBM 宣布,与上一代 Xeon 处理器相比,第五代 Intel Xeon 处理器在测试期间在其 watsonx.data 平台上实现了高达 2.7 倍的查询吞吐量,Google Cloud 将在明年部署第五代 Xeon。
基于第五代 Gen Xeon 的服务器将于 2024 年第一季度开始由领先提供商提供。主要 CSP 将宣布全年推出基于第五代 Xeon 处理器的实例。
英特尔表示 未来的英特尔至强处理器 预计明年将在能效和性能方面取得重大进步。 Sierra Forest 具有 E 核效率,核心数高达 288 个,预计将于 2024 年上半年上市,其次是 Granite Rapids,具有 P 核性能。
对于开发人员来说,英特尔在 PyTorch 和 TensorFlow 等人工智能框架中进行了优化,提供了基础库(通过 oneAPI)以使软件在不同类型的硬件上具有高性能,并提供了高级开发人员工具,包括英特尔的 oneAPI 和 OpenVINO 工具包。
-
2024-06-12
-
2024-06-03
-
2024-05-22
-
2024-05-22
-
2024-05-09