IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和

IBM 推出 Telum 处理器:8 核、5+ GHz、256 MB 二级缓存和 AI 加速器
金融机构、预订系统和其他关键业务运营商喜欢 IBM 的大型机器,因为它们的可靠性 。IBM系统名称System Z的字母 z 表示零停机时间 。
在 Hot Chips 33 大会上,IBM公司推出了新一代 z 处理器,它在历史上首次获得命名,名字为 Telum 。在新架构中,IBM 还引入了以前在 System z 中没有使用过的新解决方案,专为打击欺诈而设计 。
IBM 的一些主要客户——大型金融公司和银行——长期以来一直在期待内置了 AI 的处理器工具,因为他们的系统必须每秒处理成千上万笔交易,并尽可能可靠地进行处理 。Telum 开发的目标之一是引入在交易处理过程中实时发生的推理计算,而无需向系统外发送任何数据 。
因此,Telum 中的推理加速器直接连接到缓存子系统,并使用所有 z/Architecture 处理器和内存保护机制 。因此,单独的固件可以控制加速器的操作,可以对其进行更改以优化特定客户端的任务 。它在其中一个核心和加速器本身上执行,加速器与该核心进行通信,并负责访问内存和缓存、安全性和数据完整性以及管理实际计算 。
加速器包括两种类型的引擎 。第一个有 128 个 SIMD 模块,用于 FP16 数据的 MAC 运算,并且是矩阵乘法和卷积所需要的 。第二个只有 32 个 SIMD 块,但它可以处理 FP16 / FP32 数据,并针对网络激活功能和其他更复杂的任务进行了优化 。它们由一块超快内存(便笺簿)和一个负责移动和准备数据的“智能”IO 引擎补充,这些数据可以即时重新格式化 。
Scratchpad 连接到一个模块,该块从 L2 缓存下载数据并将计算结果发回 。IBM 单独强调,专用 AI 加速器的存在允许在内核中并行使用传统的 SIMD 块 。
【IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和】加速器可以从用户空间访问,包括在虚拟化环境中 。为了使用新的加速器,提供了 IBM 深度学习编译器,这将有助于优化导入的 ONNX 模型 。还有对 TensorFlow、IBM Snap ML 和一系列流行开发工具的开箱即用支持 。每个处理器有一个 AI 加速器,性能超过 6 teraflops FP16 。
在 RNN 测试模型上,为了防作弊,芯片可以执行 11.6 万次推理操作,延迟在 1.1 ms 以内,而对于 32 个处理器的系统,这个数字已经达到 360 万次推理操作,并且延迟增加仅高达1.2 毫秒 。除了AI加速器,还有一个所有核心通用的(去)压缩(gzip)加速器+每个核心还有一个CSMP引擎 。
数百种用于检查和重新检查可操作性的不同机制负责可靠性 。因此,例如,寄存器和缓存被复制,允许在 yal 失败的情况下使其完全重新启动并从中断的地方继续执行任务 。而对于加密无误的 RAM,则使用了内存冗余阵列 (RAIM) 模式,这是一种 RAID 阵列,其中一个缓存线一次“涂抹”在八个模块之间 。
Telum 继承了它的前身 z15 很多优点,但仍然有根本的不同 。该处理器包含八个内核,支持“智能”深度乱序执行和 SMT2,以超过 5 GHz 的频率运行 。每个内核都依赖 32 MB 的 L2 缓存 。
缓存之间通过带宽超过320 GB/s的双向环形总线相互通信,从而形成一个体积为256 MB,平均延迟为12 ns的虚拟L3缓存 。每个 Telum 芯片可以包含一个 (SCM) 或两个 (DCM) 处理器 。并且在一个节点中最多可以有四个芯片,即最多八个 CPU,按照每个 320 GB / s 的相同速度的方案组合 。
这样,在节点的框架内,就形成了一个体积为2GB的虚拟L4缓存 。据 IBM 称,缓存的扁平拓扑提供了与 z15 相比具有更低延迟的新处理器 。最多可扩展到 32 个处理器,但单个节点通过多个连接以单向“仅”45 GB/s 的速度链接 。
Telum 包含 220 亿个晶体管,正常运行时的 TDP 为 400W 。该处理器将在三星工厂使用 7nm EUV 工艺技术制造 。它将成为 IBM z16 和 LinuxNOW 大型机的大型机 。软件平台仍将是传统的 z/OS 和 Linux 。

IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和

文章插图
IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和

文章插图
IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和

文章插图
IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和

文章插图
IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和

文章插图
IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和

文章插图
IBM 推出 Telum 处理器8 核、5+ GHz、256 MB 二级缓存和

文章插图