技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡评测:性能飞跃 温度更“嘉”( 二 )


技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡评测:性能飞跃 温度更“嘉”文章插图
正逆转功能
在内部 , 搭载了5根高性能复核导热管 , 可以直接与GPU相接触 , 最大效率的进行散热 。 整套散热系统搭配起相得益彰 , 关于温度方面的测试 , 将会在下文体现 。
技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡评测:性能飞跃 温度更“嘉”文章插图
在接口方面 , 技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡搭载了2个HDMI 2.1接口 , 还有2个 DP 1.4a接口 。 新增的HDMI 2.1接口 , 可以支持单线8K的视频输出 , 而上一代HDMI 2.0仅支持4K 98Hz的视频输出 , 如果想要连接8K电视 , 则需要更多的线缆支持 。
技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡评测:性能飞跃 温度更“嘉”文章插图
技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡评测:性能飞跃 温度更“嘉”文章插图
在供电方面 , 技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡采用的是单6Pin+单8Pin的设计 。 同时在显卡的上方搭载了一个RGB LOGO灯 。
关于显卡的外观 , 相信大家已经有所了解 , 接下来带大家了解一下NVIDIA Ampere架构 。
02 NVIDIA Ampere架构下RTX 3060 Ti
技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡采用了NVIDIA Ampere架构 , 我们首先来看一下RTX 3060 Ti的提升 。
第一代RTX架构 Turing下的RTX 2060 SUPER
第二代RTX架构 Ampere下的RTX 3060 Ti
相较于初代的Turing RTX架构 , NVIDIAAmpere架构在算力上有着成倍的增长 , 这一点在RTX 3060 Ti中依旧有体现 , 每个时钟执行2次着色器运算 , 而Turing为1次 , RTX 3060 Ti的着色器性能达到16.2 TFLOPS单精度性能 , 而Turing为7.2 TFLOPS 。
NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量 , RT Core达到31.6 RTTFLOPS , 而Turing为21.7 RT TFLOPS 。
全新的Tensor Core可自动识别并消除不太重要的DNN权重 , 处理稀疏网络的速率是Turing的两倍 , 算力高达129.6 TensorTFLOPS , 而Turing为57.4 TensorTFLOPS 。
技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡评测:性能飞跃 温度更“嘉”文章插图
技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡采用GA104核心拥有174亿个晶体管 , 392平方毫米的面积 , 基于三星的8nm NVIDIA定制工艺 , 另外在RTX 3060 Ti中我们都知道仍然采用了GDDR6显存 , 不过不同于RTX 3080的Micron , RTX 3060 Ti采用了三星的GDDR6显存 。
我们在发布会中经常听到性能翻倍的说法 , 其实是因为本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元 , 这就使得每个SM的FP32运算单元数量提高了一倍 , 同时吞吐量也就变为了一倍 。
而通常我们计算显卡的CUDA数量 , 并不是把SM中的所有单元加起来计数 , 而是只统计FP32单元的数量 , 所以这样一来 , SM中的【FP32 : INT32】 从 1:1 变为 2:1 。
【技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡评测:性能飞跃 温度更“嘉”】RTX 3060 Ti共有4864个CUDA , 其实它有2432个INT32单元 , 但由于内部的FP32数量翻了一倍 , 所以最终实现了4864这个惊人的数字 。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助 , 通常在游戏中浮点运算相比整数计算要常用的多 , 图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令 , 而FP32的加速也有助于光线追踪降噪着色器 。
技嘉RTX 3060 Ti GAMING OC PRO 魔鹰显卡评测:性能飞跃 温度更“嘉”文章插图
光追工作原理示意
在此次的NVIDIAAmpere架构中 , NVIDIA官方宣布为第二代RT Core , 它和第一代有什么不同呢 。 首先要知道RT Core的工作原理是 , 着色器发出光线追踪的请求 , 交给RT Core来处理 , 它将进行两种测试 , 分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersectiontesting) 。 基于BVH算法来判断 , 如果是方形 , 那么就返回缩小范围继续测试 , 如果是三角形 , 则反馈结果进行渲染 。