英伟达发布新卡皇--RTX4090,较上一代3090Ti性能巨大飞跃!
以下是与上一代卡皇?Ampere架构的3090Ti的参数比较:
RTX 4090 采用了台积电4纳米工艺,集成76亿个晶体管。由于采用了更先进的工艺,与上一代仅28亿晶体管的3090芯片裸片尺寸大体相等。
RTX 4090有 128 个 SM 和 2,520 MHz 升压时钟,再加上 24GB GDDR6X 内存,运行速度为 21 Gbps,具有 384 位接口。内存配置与RTX 3090 Ti相比基本没有变化,然而,就像 AMD 对 RDNA 2 的 Infinity Cache 所做的一样,Nvidia 显然会在 AD102 中打包 96MB 的 L2 缓存,而 GA102 中只有 6MB 的 L2 缓存——这还没有得到官方证实,但我们认为没有理由怀疑这一点阶段。
与 Ampere 相比,核心数量增加了 50% 以上。仅核心数量就可以大幅提升性能,但Nvidia 还调整了 Ada 以达到更高的时钟频率,预期提升时钟为 2.5-2.6 GHz。这比 RTX 3090 的 1,695 MHz 升压时钟高出近 50%,比 RTX 3090 Ti 的 1,860 MHz 高出 35%,
结合起来,GPU 着色器计数和时钟速度产生了理论上的最大性能数据。RTX 3090 的额定值为 35.6 teraflops,RTX 3090 Ti 将其提升至 40 teraflops,而现在 RTX 4090 将指针推高至 82.6 teraflops — 换句话说,是计算能力的两倍多。虽然仅 teraflops 可能是一个毫无意义的数字,但它在类似的架构中仍然有用。
核心数量和时钟速度有所提高,但更重要的是,架构更新可以进一步提升性能。在 GPU 着色器上,Nvidia 表示 Ada 内核的功率效率高达两倍。着色器还支持称为 SER 的新功能,即着色器执行重新排序,这似乎主要有助于提高光线追踪性能,但在传统渲染模式中也可能有用。