283亿晶体管怪兽!显微镜下看NVIDIA RTX 30核心

芯片显微拍照大神Fritzchens Fritz终于对NVIDIA RTX 30系列下手了 , 拆开一块RTX 3090 , 拍下了GA102核心的内核图 , 而芯片分析大神Locuza借此研究了GA102核心的内部模块布局 。
283亿晶体管怪兽!显微镜下看NVIDIA RTX 30核心文章插图
RTX 3090使用的GA102-300-A1GPU核心 。 由于裸露在外而没有散热顶盖 , 很容易观察到 。
它采用三星8nm工艺制造 , 集成283亿个晶体管 , 面积628.4平方毫米 。
283亿晶体管怪兽!显微镜下看NVIDIA RTX 30核心文章插图
这张高清图上 , 可以一目了然地看到GA102核心的布局 。
283亿晶体管怪兽!显微镜下看NVIDIA RTX 30核心文章插图
对比NVIDIA官方公布的核心照渲染图 , 可以发现实际照片与之符合得非常好 。
一般来说 , 这种展示芯片结构的渲染图都会做很多修饰和调整 , 使之更加美观 , 但是看起来NVIDIA对于GA102非常自信 , 基本原貌展示了出来 , 当然细节上还是有很多差异 。
283亿晶体管怪兽!显微镜下看NVIDIA RTX 30核心文章插图
283亿晶体管怪兽!显微镜下看NVIDIA RTX 30核心文章插图
从这两张图上 , 可以看到GA102核心的诸多模块 , RTX 3090使用的是阉割残血版 , 而这里能看到所有单元 。
GA102核心共有7组GPC(图形处理集群) , 每个GPC内包含6组TPC(纹理处理集群) , 而每组TPC内包含两组SM(流式多处理器) , 最后每一组SM内包含128个流处理器 , 整个核心总计10752个流处理器(RTX 3090启用了10496个) 。
当然 , 安培架构的流处理器已经不再那么单纯 , 细分的话包括FP32浮点核心、INT32整数核心 , 这里就不展开了 。
另外 , 从图上还可以看到两组NVLink互连控制器、12组共384-bit GDDR6X显存控制器、24块总计6MB二级缓存、指令前端、几何处理器、光栅处理器、几何引擎、光栅引擎、ROP光栅单元等等 。
【283亿晶体管怪兽!显微镜下看NVIDIA RTX 30核心】不过仍有很多地方无法识别究竟何用 , 也不确认显示控制器、PCIe 4.0控制器等等到底在哪里 , 另外RT光追单元、Tensor张量单元也无法直接看出来 。
283亿晶体管怪兽!显微镜下看NVIDIA RTX 30核心文章插图