NVIDIA RTX 3070 Ti显卡怎么样 NVIDIA RTX 3070 Ti显卡评测

NVIDIA RTX 3070 Ti显卡怎么样 NVIDIA RTX 3070 Ti显卡评测,第1张

NVIDIA RTX 3070 Ti显卡怎么样 NVIDIA RTX 3070 Ti显卡评测

NVIDIA RTX 3070 Ti显卡今日首发,想买的小伙伴可以准备开抢了,那么这款显卡各方面性能怎么样呢?感兴趣的朋友不要错过这篇评测了。

GeForce RTX 3070 Ti

而RTX 30系显卡截止目前还未宣布哪款显卡将停产,如果说NVIDIA是觉得去年发布的RTX 30系显卡定价过低,想推出Ti系列来提高售价,但从已发布的GeForce RTX 3080 Ti来看,虽然价格上去了,但性能同样约等于GeForce RTX 3090,换算过来其实价格并没有变化。

GeForce RTX 3070 Ti

在之前的台北电脑展上,GeForce RTX 3070 Ti的价格已经曝光,为4499元起。在看过了GeForce RTX 3080 Ti的性能提升后,相信大家已经迫不及待了,今天我们就来看看这款GeForce RTX 3070 Ti的性能提升如何。

01 GA104核心的第二张显卡

在核心架构上,GeForce RTX 3070 Ti是采用GA104核心的第二张卡,官方白皮书上对比的对象为GeForce RTX 2070 SUPER,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3070 Ti每个时钟执行2次着色器运算,而Turing为1次,RTX 3070 Ti的着色器性能达到22 TFLOPS单精度性能,而Turing为9 TFLOPS。

新老两代显卡算力对比

NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到42 RT TFLOPS,而Turing为24 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。

第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达174 Tensor TFLOPS,而Turing为72 Tensor TFLOPS。

GeForce RTX 3070 Ti采用了GA104核心,与GeForce RTX 3070相同,不过NVIDIA官方并没有给出GA104核心架构图,我们仍以GA102来做讲解。

完整的GA102核心

完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3070 Ti的CUDA数量是6144个,共有48个SM单元,也就是3个GPC 24个TPC,而刚刚发布的GeForce RTX 3080 Ti共有40个TPC 80个SM单元,这也是两款芯片的差距所在。

公版显卡参数表

为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3070与GeForce RTX 3070 Ti的差距不大,相差的两个SM单元,和刚刚发布的GeForce RTX 3080 Ti情况基本相同,也就是1组TPC,256个CUDA。只不过GeForce RTX 3080 Ti更接近GeForce RTX 3090,而根据参数来看GeForce RTX 3070 Ti与GeForce RTX 3080还有一定差距。

GDDR6X

另外GeForce RTX 3070 Ti的显存虽然依旧是8GB,但已经由GDDR6更换为GDDR6X,两者的区别主要在于频率和带宽上,同频下实现更高的显存带宽可以降低成本和功耗,另外在相同时间内GDDR6X可以比GDDR6传输多2倍的数据。这对于需要大量数据负载的工作尤为重要,如光线追踪的游戏、AI学习和8K视频渲染。

02 NVIDIA Ampere架构GA104解析

GeForce RTX 3070 Ti采用了GA104核心,拥有174亿(17400 million)个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存,这里与GeForce RTX 3070的GDDR6有所区别。

本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。

而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。

GeForce RTX 3070 Ti共有6144个CUDA,其实它有3072个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了6144的CUDA数量。

而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算 *** 作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。

在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。

虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。

传统的数据交换

在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。

RTX IO可以极大解放CPU负担

当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。

同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。

03 GeForce RTX 3070 Ti外观

首先还是来看一下外观,在外包装上相比之前的公版没有变化,不过显卡本身GeForce RTX 3070 Ti更像是GeForce RTX 3080的mini版,与GeForce RTX 3070相距甚远。

GeForce RTX 3070 Ti配件盒展示

外包装依旧是礼盒形式的,收藏感满满,在拿出显卡后下方是转接线和说明书的配件盒,因为此次公版仍采用单12pin的供电插槽,所以需要转换成双8pin的接口才能使用。

GeForce RTX 3070 Ti

GeForce RTX 3070

显卡正面我们对比一下GeForce RTX 3070,可以看到GeForce RTX 3070仍然采用了单面双风扇的设计,而GeForce RTX 3070 Ti则是采用了轴流式设计,两侧均有风扇。除此之外,显卡的整体外边框设计基本相似。

GeForce RTX 3070 Ti

GeForce RTX 3070

GeForce RTX 3070 Ti的背面其实更像GeForce RTX 3080,包括金属边框以及表面的磨砂质感,只是从体积上略小一号。

GeForce RTX 3070 Ti 内角的金属光泽

与GeForce RTX 3080 Ti在边框部位的改动相同,GeForce RTX 3070 Ti的内角从哑光改为了镜面,这种略带跳跃的视觉效果相比之前的设计更好看。

GeForce RTX 3070 Ti 单12pin供电接口

在GeForce RTX 3070 Ti显卡的侧面,可以看到单12pin的供电接口,从整体来看它比较靠近中间部位,但我们都知道公版卡采用了高度紧凑的PCB板,长度也小于一般尺寸,所以其实供电接口已经位于板子的尾部,没有往右挪的空间了。根据NVIDIA官方说明,GeForce RTX 3070 Ti的单卡功耗为290W,推荐750W及以上电源。

另外在边框的配色上GeForce RTX 3070 Ti的颜色几乎为纯银色,而GeForce RTX 3080和GeForce RTX 3080 Ti则为玫瑰金。

GeForce RTX 3070 Ti视频接口

GeForce RTX 3070 Ti的挡板部位整体设计与GeForce RTX 3070相同。接口方面的配置依旧为DP 1.4a*3+HDMI 2.1*1的4接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。

04 3DMARK 理论性能测试

首先介绍一下测试平台,为了保证此次评测能够发挥GeForce RTX 3080 Ti显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。

在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

GPU-Z参数

首先看一下GPU-Z的参数,GeForce RTX 3070 Ti采用GA104核心,三星8nm工艺,芯片面积392平方毫米,拥有6144个CUDA,1770MHz频率。采用8GB GDDR6X显存,位宽为256bit,显存带宽达到了608.3 GB/s,光栅单元和纹理单元为96和192。

下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

3D MARK FS套装测试

在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应GeForce RTX 3070 Ti的性能水平。

可以看到GeForce RTX 3070 Ti的性能显然更接近GeForce RTX 3070,整体提升10%左右;对比GeForce RTX 3080的差距为17%左右;相比上一代的GeForce RTX 2070 SUPER提升45%左右。

3D MARK TS套装测试

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,GeForce RTX 3070 Ti的分数提升稍弱,相比GeForce RTX 3070提升7%左右。而对比GeForce RTX 3080的分数差距为23%左右;对比上一代GeForce RTX 2070 SUPER的分数要高出42%左右。

3D MARK 光追测试

PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中GeForce RTX 3070 Ti的表现更贴近GeForce RTX 3070,分数提升为6%左右;对比GeForce RTX 3080的分数差距为31%左右;对比上一代GeForce RTX 2070 SUPER的分数提升则非常大,约为50%。

这是比较理想的等差数列

另外我们对比了一组比较有意思的数据,综合来看目前GeForce RTX 30系显卡性能,形成等差数列的游戏卡型号分别为RTX 3060、RTX 3060 Ti、RTX 3070 Ti以及RTX 3080,所以个人来看GeForce RTX 3070与GeForce RTX 3070 Ti的型号会有些许冲突,不知道NVIDIA后续是否会有停产GeForce RTX 3070的打算。

05 游戏性能测试

在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。

另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。

《刺客信条:英灵殿》游戏测试

在游戏实测中可以看到GeForce RTX 3070 Ti和GeForce RTX 3070的帧数差距并不明显,平均下来为2%左右。而对比GeForce RTX 3080的分数差距整体在12%左右。

《德军总部新血脉》游戏测试

上一页12 下一页 阅读全文

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/bake/1328872.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-12
下一篇 2022-06-12

发表评论

登录后才能评论

评论列表(0条)

保存