英伟达“Logan”将开普勒带到移动芯片?

英伟达“Logan”将开普勒带到移动芯片?,第1张

  自从英伟达涉足移动领域以来,英伟达已经很久没在GPU这块大动筋骨了。往好的方面想,Tegra上面用到得GPU是当前最好的了,从差的方面看的话,严格来说,这需要改进了。英伟达经常被指责是一个不成熟的生态系统,认为其不愿意为大型SOC支付所需的费用,以给市场带来高性能的SoC。值得庆幸的是这一切都开始改变了。在今年的早些时候,英伟达发布了到2015年的移动SOC的roadmap,其中包括了2014年发布的Logan项目。这是英伟达第一款配备开普雷架构GPU的移动SOC。在昨天的Siggraph上,英伟达第一次展示了Logan的硅晶片。

  英伟达大概三个礼拜前从晶圆厂拿到了这个硅片。我们几乎可以肯定的是用的是28nm的某种工艺,而并不是之前说的20nm样片。

  英伟达没有具体谈到他们的CPU内核,但很大可能Logan会是另一个4+1内核的设计。有可能仍然是基于ARM A15 IP(也有可能是另一个新版本的核心)。在英伟达已经确认了我们的猜测,在GPU方面,Logan用到得是单个开普勒SMX:

  英伟达“Logan”将开普勒带到移动芯片?,/upload/website_attach/20220726/162100L36-0.png,第2张

  一个开普勒SMX拥有192个CUDA核心。英特率没有谈到推出产品的GPU频率。但他提供了图表,让我们确定可以从正确方向去考虑Logan GPU的能力。

  英伟达“Logan”将开普勒带到移动芯片?,/upload/website_attach/20220726/1621005K2-1.png,第3张

  别高兴的太早,以上只是GFLOPS的对比,并不是游戏里面的真实性能表现,理论上,移动开普勒ALU的峰值比PS3或者Geforce8800GTX(内存带宽是另一回事)强。如果我们细心观察这个图表,我们将移动开普勒和iPad4相比,我们就会知道英伟达需要怎样的的时钟速度才能达到这种水平的性能。在Photoshop上做一些快速估值,我们可以看出英伟达认为移动开普勒从某些方面来说,其FP基本上是iPad4用到得PowerVR SGX 554MP4 (76.8 GFLOPS)的5.2倍。得出的结果则是400 GFLOPS。随着开普勒192核心的实现,你在每个核心上可以得到2FLOPS,或者说每个周期有384FLOPS。为了达到 400 GFLOPS,你需要把移动开铺率GPU的时钟提到1GHZ。从架构的角度来看,这完全是可行的(尽管我们在28nm的制程上面没见过类似的产品)。但这对于智能手机来说似乎有点性能过剩。

  英伟达似乎不是很想去谈关于频率的事情,但他们说道我们很快或许很快可以在某款平板上见到。我认为时钟频率会偏低。即使只有一半的频率,我们现在谈论的可是PS3 GPU水平的FP在移动SOC上

  实现。我们对于Logan的内存子系统也无从得知,很显然这个在真实的游戏世界里面能够起到很重要的作用。但我们未能得到真实的数据。这么多年来我们一直在鄙视英伟达的移动GPU。但这次Logan貌似要改变这个格局。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/2517420.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-05
下一篇 2022-08-05

发表评论

登录后才能评论

评论列表(0条)

保存