NVIDIA 实现性能巨大飞跃,GeForce RTX 40 系列开创神经网络渲染新时代
2022 年 9 月 20 日,美国加利福尼亚州圣克拉拉,2022 秋季 GTC 大会 ——NVIDIA 今天发布 GeForce RTX? 40 系列 GPU,旨在为游戏玩家和创作者提供革命性性能,其中新旗舰产品 RTX 4090 GPU 的性能相较上一代提升最高可达 4 倍。
作为全球首款基于全新 NVIDIA? Ada Lovelace 架构的 GPU,RTX 40 系列在性能和效率上都实现了巨大的代际飞跃,意味着实时光线追踪和利用 AI 生成像素的神经网络渲染的新时代已然来临。
NVIDIA 创始人兼首席执行官黄仁勋在 GTC 大会主题演讲的 GeForce? Beyond 特别直播上介绍到:"RTX 光线追踪和神经网络渲染的时代正在全面展开,全新 NVIDIA? Ada Lovelace 架构将其推向了新的高度。”
"Ada 为游戏玩家提供了质的飞跃,并正在为完全基于仿真的未来游戏铺路。Ada 的性能是上一代产品的 4 倍,并为整个行业设立新标准。" 黄仁勋表示。
NVIDIA Racer RTX 是利用 GeForce RTX 40 系列 GPU 和 NVIDIA DLSS 3 创建未来游戏内容的例子
DLSS 3 可生成全新帧以加速游戏性能
黄仁勋还宣布 NVIDIA DLSS 3 --用于游戏和创作应用的 Deep Learning Super Sampling 深度学习超级采样是神经网络图形技术的下一次革命。这项由人工智能驱动的技术可以生成全新帧,从而大幅提高游戏性能。DLSS 3 也可以通过允许 GPU 生成全新帧来克服受 CPU 限制的游戏。
DLSS 3 即将加入到全球最热门的游戏引擎包括 Unity Engine 和虚幻引擎中。同时,DLSS 3 也已获得众多全球领先的游戏开发者的支持,超过 35 款游戏和应用即将支持该技术。
此外,RTX 40 系列 GPU 具有一系列新的技术创新,包括:
●流式多处理器具有高达 83 TFLOPS 的着色器能力,吞吐量超过上一代产品 2 倍。
●第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
●第四代 Tensor Cores 具有高达 1.32 Petaflops 的 FP8 张量处理性能,超过上一代使用 FP8 加速性能的 5 倍。
●着色器执行重排序(SER)通过即时重新安排着色器负载来提高执行效率,从而更好地利用 GPU 资源。作为与 CPU 的乱序执行一样的重大创新,SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
●Ada 光流加速器带来 2 倍的性能提升,使 DLSS 3 能够预测场景中的运动,使神经网络能够在保持图像质量的同时提高帧率。
●架构上的改进,与 TSMC 4N 定制工艺技术紧密结合,实现了高达 2 倍的性能功耗比飞跃。
●双 NVIDIA 编码器(NVENC)将输出时间至多缩短一半,并支持 AV1。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多的公司都已在采用 NVENC AV1 编码器。
全新光线追踪技术让游戏更具沉浸感
几十年来,用正确的物理照明来实时渲染光线追踪场景一直被认为是图形学领域的重大突破。同时,随着 3D 游戏和图形学不断努力提供对现实世界最精确地展现,环境和物体渲染的几何复杂性也在不断增加。
实现物理准确的图形需要巨大的计算能力。像《赛博朋克 2077》 (Cyberpunk 2077) 之类的现代光线追踪游戏,我们对每个像素执行超过 600 次光线追踪计算来确定光照,这与四年前推出的首批光线追踪游戏相比,提升达 16 倍。
全新第三代 RT Cores 可以提供 2 倍的光线与三角形求交性能,以及两个全新的重要硬件单元。Opacity Micromap 引擎将光线追踪的 Alpha-Test 几何性能提升 2 倍;而全新的 Micro-Mesh 引擎可动态生成微网格,以产生额外的几何图形。Micro-Mesh 引擎可在提升几何图形丰富度的同时,不以传统复杂几何图形处理的性能和存储成本为代价。
RTX Remix、新 AV1 编码器重新定义创作
RTX 40 系列 GPU 和 DLSS 3 为所有 NVIDIA Studio 的创作者带来了助力。3D 艺术家无需代理就可以利用精确的物理学和逼真的材料渲染完整的光线追踪环境,并实时查看效果。
视频编辑和直播也因 GPU 性能的提升和全新第八代编码器中 AV1 的加入而得以提升。NVIDIA Broadcast 软件开发工具包有三个更新,包括: 面部表情预估,眼神追踪,以及虚拟绿幕的质量改进,现已提供给合作伙伴。
包含在 NVIDIA Studio 全套创意应用中的 NVIDIA Omniverse?即将增加 NVIDIA RTX Remix。NVIDIA RTX Remix 是一个 MOD 平台,用于为经典游戏添加 RTX 效果。RTX Remix 允许 MOD 爱好者轻松捕捉游戏素材,利用强大的 AI 工具自动增强材质,并通过光线追踪和 DLSS 快速将游戏 RTX 化。
推出《传送门》(Portal)RTX 版
NVIDIA Lightspeed Studios 利用 RTX Remix 重新设计了 Valve 的经典电子游戏《传送门》(Portal),该游戏被认为是有史以来最好的视频游戏之一。全景光线追踪和 DLSS 3 等先进的图形功能为该游戏带来了引人注目的全新画质和整体体验。恰逢《传送门》(Portal)15 周年,《传送门》(Portal)RTX 版免费 DLC 将于 11 月发布。
GeForce RTX 4090 和 4080:全新的终极 GPU
GeForce RTX 4090 GPU 是全新 GeForce RTX 40 系列的旗舰产品,是全球首款基于全新 NVIDIA Ada Lovelace 架构的游戏 GPU
RTX 4090 是全球最快的游戏 GPU,在功耗、静音、散热等方面技惊四座。在完整的光线追踪游戏中,与上一代采用 DLSS 2 的 RTX 3090 Ti 相比,采用 DLSS 3 的 RTX 4090 的性能提升可达 4 倍。在现代游戏中,RTX 4090 的性能提升高达 2 倍,同时保持了相同的 450W 功耗。RTX 4090 具有 760 亿个晶体管、16384 个 CUDA? 核心和 24 GB 高速美光 GDDR6X 显存,在 4K 分辨率的游戏中持续以超过 100 FPS 运行。RTX 4090 将于 10 月 12 日上市,建议零售价 ¥12999 元起。
NVIDIA 还宣布推出采用两种配置版本的 RTX 4080。RTX 4080 16GB 拥有 9728 个 CUDA 核心和 16 GB 高速美光 GDDR6X 显存,在现代游戏中的性能可达 GeForce RTX 3080 Ti 的 2 倍;在较低功率下,性能比 GeForce RTX 3090 Ti 更强大。RTX 4080 12GB 则拥有 7680 个 CUDA 核心和 12GB 美光 GDDR6X 显存,比上一代旗舰 GPU -- RTX 3090 Ti 性能更强大。
两种配置版本的 RTX 4080 将于 11 月上市,建议零售价分别为 ¥9499 元起和 ¥7199 元起。
购买途径
华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰等顶级显卡供应商将在中国推出 GeForce RTX 4090 和 4080 GPU 标频版和超频版。
NVIDIA 也将限量推出 RTX 4090 和 RTX 4080(16GB)FE 版,以满足渴望获得 FE 版设计的粉丝需求。
GeForce RTX 40 系列 GPU 还会通过宏碁,外星人,华硕,戴尔,惠普,联想和微星等全球领先 OEM 的产品出售。