映众RTX 3080 Ti冰龙超级版全面评测

映众RTX 3080 Ti冰龙超级版全面评测,第1张

映众RTX 3080 Ti冰龙超级版全面评测

大家都知道GeForce RTX 3080 Ti发售了,那么今天我们评测的这款显卡正式来自映众的GeForce RTX 3080 Ti冰龙超级版。

在此我们顺便来说说用户比较关心的挖矿问题,在6月2日黄仁勋的远程媒体见面会上提到,上个季度NVIDIA的CMP矿卡实现1.5亿美元的收入,而本季度恐怕能达到4亿美元左右。他认为CMP矿卡的出现是让GeForce游戏卡更多被游戏用户买到的好政策。

映众GeForce RTX 3080 Ti 冰龙超级版

目前新的GeForce RTX 3080 Ti算力约为60MH/s,基本相当于未锁算力的GeForce RTX 3070,但新卡的功耗更高价格更贵,如果以性价比来看,GeForceRTX 3080 Ti对于挖矿完全没有竞争优势,反而投资CMP矿卡更为合适。

另外除了下游的限制,政府也开始重点监管,在5月25日“挖矿重灾区”内蒙古已经颁布了八项措施严厉打击挖矿,相关文章可以翻看我们之前的消息,这里不过多讲解了:内蒙古八大措施禁止挖矿 警惕矿卡回流。另外我们也有相关文章来教大家如何简单鉴别矿卡:矿难来临时矿卡能买么? 警惕妹子自用显卡。

映众GeForce RTX 3080 Ti 冰龙超级版

虽然目前来看,GeForce RTX 3080 Ti本次供货量依旧十分可怜,不过乐观预计,半年左右显卡价格将会逐步回落。我们还是先来看本次评测的映众GeForce RTX 3080 Ti冰龙超级版显卡,在测试开始前,笔者先将这款显卡的特点列出方便大家阅读:

Boost频率达到1710MHz,高于公版

RGB灯箱效果意外的好

三大一小的4风扇散热

总的来说,映众GeForce RTX 3080 Ti 冰龙超级版在外观上延续了该系列一贯风格,除了浓重的金属气息,两种材质互相拼接,加上“铆钉”点缀,整体极具质感。性能方面,GeForce RTX 3080 Ti除了与GeForce RTX 3090相差12GB显存,在各方面几乎都与之追评,而限制以太坊算力这一举措,也让真玩家有机会用上游戏卡,但目前来看全球的出货量仍然堪忧,我们不妨继续做等等党。

01 旗舰核心GA102-225-A1

下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForce RTX 2080 Ti,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行2次着色器运算,而Turing为1次,GeForce RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而Turing为14 TFLOPS。

第一代NVIDIA RTX架构 Turing下的RTX 2080 Ti

第二代NVIDIA RTX架构 Ampere下的RTX 3080 Ti

NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到67 RT TFLOPS,而Turing为43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。

第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达273 Tensor TFLOPS,而Turing为114 Tensor TFLOPS。

GeForce RTX 3080 Ti仍然采用了GA102核心,与GeForce RTX 3080/3090相同,下面我们来看一看GeForce RTX 3080 Ti在GA102中做了哪些改动。

完整的GA102核心

完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3080 Ti的CUDA数量是10240个,所以可以推断GeForce RTX 3080 Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。

为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3080 Ti与GeForce RTX 3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最大差别是GeForce RTX 3090相比GeForce RTX 3080 Ti多了12GB的显存;而相比RTX 3080来说提升就非常大了。

关于这张卡的定位,更多的还是旗舰游戏,它从参数来看相比GeForce RTX 3080提升很多,非常接近GeForce RTX 3090,仅是显存相差12GB,而大显存对于软件渲染来说又是至关重要的,正如GeForce RTX 3090在发布之初的定位,就是专注于内容创作者。

渲染8K素材占用了17GB显存(点击查看大图)

如图我们使用Keyshot9做测试,渲染8K或4K素材的显存占用率非常高,能达到17GB甚至更高,这对于只有12GB显存的RTX 3080 Ti就完全不够了,爆显存的危害想必大家也知道,可以导致游戏或软件崩溃,从而进程丢失。

02 NVIDIA Ampere架构GA102解析

GeForce RTX 3080 Ti采用了GA102核心,拥有280亿(28000 million)个晶体管,628平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。

本次NVIDIA Ampere架构的SM在Turing架构基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。

而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。

GeForce RTX 3080 Ti共有10240个CUDA,其实它有5120个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了10240的CUDA数量。

而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算 *** 作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。

在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。

虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。

传统的数据交换

在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。

RTX IO可以极大解放CPU负担

当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。

同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。

03 映众GeForce RTX 3080 Ti 冰龙超级版外观

GeForce RTX 3080 Ti 冰龙超级版延续了映众一直以来的设计风格,不过其不同系列在细节上会有些许区别。

映众GeForce RTX 3080 Ti 冰龙超级版

映众GeForce RTX 3080 Ti 冰龙超级版表面采用了非常浓重的金属风格,两种材质互相拼接,加上“铆钉”点缀,整体极具质感。

映众GeForce RTX 3080 Ti 冰龙超级版

正面导流罩的主动散热部分,映众GeForce RTX 3080 Ti 冰龙超级版采用了三个11叶92mm风扇,内部ICHILLX4散热器的主散热模块使用的是7热管超密挤压直触工艺,7根热管与GPU核心完全贴合,可以快速带走热量;而为了同样发热量大的显存及供电模块散热,散热器还加装了一根热管,用于连接显存/供电的散热模块与鳍片。

映众GeForce RTX 3080 Ti 冰龙超级版上机效果

由于映众GeForce RTX 3080 Ti 冰龙超级版显卡侧面带有大面积的RGB灯箱,上机点亮后的效果着实不错。另外灯效还可以通过INNO3D TUNEIT软件设置,同时还支持炫光同步功能。

映众GeForce RTX 3080 Ti 冰龙超级版供电接口

侧面的小风扇也是区别“冰龙超级版”和“冰龙版”的配置之一,它可以快速排出散热鳍片中的热空气,为显卡起到立体散热的效果。另外由于映众GeForce RTX 3080 Ti 冰龙超级版的整体性能配置与GeForce RTX 3090相差无几,所以功耗同样在350W左右,供电接口为8+8pin的方案,建议搭配750W及以上电源。

映众GeForce RTX 3080 Ti 冰龙超级版侧面的金属臂

由于这一代显卡的重量都较大,可以看到映众GeForce RTX 3080 Ti 冰龙超级版自挡板侧面延伸出“金属臂”可以很好地为显卡起到支撑作用,即便没有单独的显卡支架也不至于压弯PCB板,是非常简单讨巧的力学设计。

映众GeForce RTX 3080 Ti 冰龙超级版背板展示

映众GeForce RTX 3080 Ti 冰龙超级版的背板同样做了非常全面的设计方案,可以看到芯片处的镂空处理,同时大面积的凹凸设计,变向增加了背板芯片和显存部位的表面积,方便发热量高的元器件散热。尾部的镂空设计可让散热鳍片中的热空气快速排出。

映众GeForce RTX 3080 Ti 冰龙超级版视频输出接口

视频输出接口依旧采用了DP1.4a*3+HDMI 2.1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。另外值得注意的是,映众GeForce RTX 3080 Ti 冰龙超级版的视频接口内采用了镀金工艺处理,可以有效起到抗氧化稳定信号传输的作用。

04 3DMARK 理论性能测试

首先介绍一下测试平台,为了保证此次评测能够发挥映众GeForce RTX 3080 Ti冰龙超级版显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。

在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

GPU-Z参数

首先看一下GPU-Z的参数,映众GeForce RTX 3080 Ti冰龙超级版采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,Boost频率达到1710MHz,而公版为1665MHz。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。

下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下(所有测试项均为一键超频后1710MHz测试结果):

3D MARK FS套装测试

在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应映众GeForce RTX 3080 Ti冰龙超级版的性能水平。

在该测试中可以发现三款显卡的分数基本难分伯仲,其中在2K/4K分辨率下映众GeForce RTX 3080 Ti冰龙超级版的分数甚至超越了GeForce RTX 3090公版的成绩。

3D MARK TS套装测试

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,映众GeForce RTX 3080 Ti冰龙超级版的分数略逊于GeForce RTX 3080 Ti的公版成绩。对比GeForce RTX 3080的分数要高出6%左右;对比上一代GeForce RTX 2080 Ti的分数要高出41%左右。

3D MARK 光追测试

PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中映众GeForce RTX 3080 Ti冰龙超级版的分数基本与公版持平;对比GeForce RTX 3080的分数提升约为11%;对比上一代GeForce RTX 2080 Ti的分数提升则非常大,约为60%。

05 游戏性能测试

在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。

另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。

《刺客信条:英灵殿》游戏测试

在《刺客信条:英灵殿》中映众GeForce RTX 3080 Ti冰龙超级版的成绩与理论测试中基本相符,会出现上下1帧的差距,但在游戏中基本感受不到。同时GeForce RTX 3080的分数差距在1080P和2K分辨率下也并不大,主要是4K分辨率会有9%左右的差距。

《德军总部新血脉》游戏测试

《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,映众GeForce RTX 3080 Ti冰龙超级版基本与另外两款同水平卡帧数相当,而相比GeForce RTX 3080的提升约为4%左右。

《孤岛惊魂5》游戏测试

《孤岛惊魂5》同样算是优化比较到位的3A大作,但在benchmark的帧数测试中经常会不稳定,在本次测试中映众GeForce RTX 3080 Ti冰龙超级版与另外两款同级别卡基本只有1帧的差距,另外在4K分辨率下的成绩领先GeForce RTX 3080较多,达到16%左右。

《无主之地3》游戏测试

上一页12 下一页 阅读全文

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/1328875.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-12
下一篇 2022-06-12

发表评论

登录后才能评论

评论列表(0条)

保存