登上性能之巅的RTX 3090 Ti,为什么要取代“老大哥
最近RTX 3090 Ti终于开卖了,关于NV发布RTX 3090 Ti这件事本身,很多人表示看不懂老黄的操作,如果没有RTX 3090 Ti的“背刺”,老大哥RTX 3090现在还能保持“消费级最强GPU”的名号,这一波直接撑到40系发布不香吗?难不成是GA102滞销了?网上关于老黄清库存的阴谋论也开始流传了。
那么今天我们就来分析一波,为什么RTX 3090 Ti要在526天之后,取代了老大哥RTX 3090性能之巅的“王座“。
对于游戏玩家来说,在8K游戏尚未普及的当下,即便是负载最高的4K游戏, RTX 3080 Ti的游戏表现已经和RTX 3090足够接近,满足60帧甚至更高的游戏帧数显然不成问题。土豪玩家要是想体验8K游戏,直接上RTX 3090拉满就完事了。
这么一说,貌似RTX 3090 Ti好像没什么发布的必要了?可能对于很多人来说,显卡就只是用来玩游戏这么简单。殊不知,显卡已经逐步发展成为满足创意工作、工程建模、机器学习等专业领域的必备硬件。而RTX 3090 Ti不仅是目前最强的游戏卡,在数据科学AI、深度学习,以及创意应用等领域,同样也有着它施展拳脚的空间。
可能有同学要问了:论专业领域NV早已深耕多年,无论是以前的Quadro系列,还是如今的NVIDIA RTX系列,都是面向专业领域的GPU,那RTX 3090 Ti岂不是要和自家系列抢饭碗?
RTX A6000
从软件优化的角度出发,以RTX A6000为代表的新一代专业图形卡,面向例如3DS Max、CAD、SolidWorks这样的专业工程软件,会提供专门的软件优化和驱动,以及独有的vGPU支持。而GeForce显卡同样也有面向创意工作者的NVIDIA Studio驱动,像Adobe全家桶、blender、达芬奇此类的创作软件,Studio驱动和工具套件会与硬件结合,提供更好的加速性能。
NVIDIA STUDIO工具套件
从硬件规格的角度出发,RTX 3090 Ti配备了和A6000相同的GA102核心,10752个CUDA流处理器,受益于更高的TDP,RTX 3090 Ti单精度浮点运算达到了40 TFLOPS,是目前Ampere架构显卡中运算和性能之王。
显存是两款GPU差别最大的地方,A6000最高配备可达48GB容量的GDDR6显存,但是RTX 3090 Ti则是更为均衡一些,它配备了更高速率的24GB GDDR6X 21Gbps显存,并且配备了面向专业领域的功能特性——显存ECC功能。
RTX 3090 Ti搭载显存ECC功能
ECC,中文名叫做“错误检查和纠正技术”,以往显存ECC技术是只有专业卡才能独享,它的好处就是在显卡处理复杂工作流时,如果显存在存放运算数据时出现错误,ECC会自动进行纠正,使系统不至于因为错误而中断运行,保持整个平台的运行稳定。
因为不少用户购买RTX 3090用于创意工作、机器学习等使用场景,工作流占用显存较高的场景下,出现运行错误容易导致系统和平台的不稳定。RTX 3090 Ti补上了ECC功能,即使不是特定领域的工作站用户,也能选择价格相对更低的GeForce显卡体验到这一专业特性。毕竟一张RTX A6000的价格,已经是RTX 3090 Ti 的三倍有余。
前面提到,RTX 3090 Ti在专业能力和硬件规格方面完全不虚专业卡,那么它的散热稳定性和实际体验又如何呢?
影驰RTX 3090 Ti 星曜OC
和以往的TITAN系列不同,NVIDIA将RTX 3090 Ti放开给AIC厂商打造,以首发测试的影驰RTX 3090 Ti 星曜OC显卡为例,Furmark烤机测试中显卡长时间保持在450W的功耗,核心和显存温度的表现也相当不错。因此在碰到大型工作项目渲染的时候,其实不必太担心显卡的散热稳定性问题。
影驰RTX 3090 Ti 星曜OC烤机稳定性测试
在进行实际的创意工作流的过程中,RTX 3090 Ti的24GB显存在运行达芬奇8K分辨率RAW项目时,正常的无特效渲染播放,其实并不会占用过多的缓存,10GB的占用,RTX 3080 Ti都可以满足。
但是在调整了运动效果中的时域降噪、时间阈值、动态模糊等一系列我们想要的特效之后,8K高分辨率的特效渲染会大量占用显存空间进行运算,这时候RTX 3090 Ti的大显存优势便得到了发挥,如果是RTX 3090以下的显卡,渲染会直接提示报错。
影驰RTX 3090 Ti 星曜OC达芬奇实时渲染
来到热门3D建模软件blender,我们同时加载了一个双镜头的动画和实时场景动画项目,在使用内置的Cycles渲染器在交互渲染的过程中,会利用实时RTX光线计算和OpitX AI去噪技术的实时加载,类似这样的多工作流同时运行,对于显存的占用其实是相当之大的。
影驰RTX 3090 Ti 星曜OC blender实时渲染
RTX 3080 Ti blender实时渲染爆显存
在同时运行两个工作流之后,最后将实时场景进行帧渲染,可以看到显卡最高占用已经达到21GB,拥有高性能核心和大显存优势的RTX 3090 Ti在面对复杂的创意工作环境显然会更加游刃有余。
通过一系列的分析和影驰RTX 3090 Ti 星曜OC的实际体验,RTX 3090 Ti这块性能猛兽,在专业领域,依托于GA102满血大核心、24GB容量的高速ECC显存以及NVIDIA STUDIO创意工具,为创意设计人士发挥灵感带来高效和迅速的GPU加速性能体验。同时也能用于数据分析、深度学习以及可视化场景的深度应用。这是目前消费级最强大的GPU,对配置要求硬核的游戏玩家、内容创作者和数据科学家,相对而言,选择RTX 3090 Ti,比选择A6000更有“性价比”。
第三代NVLink模块
如果你觉得24GB显存不够折腾,购买2张RTX 3090 Ti+NVLink组成双卡48GB显存,价格都要比一张A6000低不少,可以说是组建顶级深度计算或图形工作站较为“划算”的方案了。