应对下一代移动图形处理的挑战_技术

GPU市场增长与Mali™ 技术的成功

2006年，图形处理器（GPU）总出货量约为1.35亿，广泛用于智能手机、DTV和平板电脑等多种设备。同年，ARM® 完成对挪威Falanx公司的收购，并获得其移动GPU技术，完成对原有IP技术的扩展。10年后的今天，仅智能手机的全球出货量就已达到15亿台（据ARM内部数据和Gartner数据显示）；短短10年时间，ARM Mali技术也已成为全球出货量第一的GPU，2015年总计出货量超过7.5亿。

本文将重点讨论GPU市场、技术、应用案例，以及GPU爆炸式发展背后的深层原因。同时，文章还将简述ARM Mali GPU及其架构在过去10年的演进，并介绍搭载全新Bifrost架构的Mali-G71。

API与制程节点开发

对图形领域而言，2015年振奋人心——全新应用程序接口（API）的出现允许开发商将基础图形硬件发挥至技术允许的最高水平。

同年，Khronos团队的工作引发有关Vulkan的热烈讨论。Vulkan是新一代OpenGL API，为新一代图形API设计量身打造。Vulkan足以满足全部需求，并彻底终结了OpenGL ES和OpenGL作为API各自为政的时代。

Vulkan于2016年2月正式发布，是首款按照开发商需求设计的Khronos API。它由游戏引擎开发商、芯片提供商、IP公司和 *** 作系统供应商共同开发，以期打造兼顾各相关方需求的最佳解决方案。Vulkan API应运而生，采用全新异构系统，不仅内置多线程支持，而且可以最大程度发挥硬件一致性的优势。Vulkan属于底层API，允许开发商自主决定硬件交互方式，并通过底层接入以找到最佳平衡点。

上述特性对虚拟现实（VR）等新兴应用尤为重要，帮助开放商减少延迟，优化图形流水线。

对聚焦GPU运算应用的开发商来说，OpenCL 2的发布是一个重要节点，多项全新理念进一步简化了高性能GPGPU应用的开发流程。虚拟存储共享概念的提出可以说最为关键，允许CPU和GPU之间的虚拟地址共享。与硬件一致性结合后，细粒度缓冲器共享成为现实。该技术简化了实现CPU和GPU工作负载共享所需的开发工作，因为两者间的数据双向传输不再是必要条件。

半导体制造工艺也经历了巨大革新。2014年，台积电与三星推出20纳米工艺节点，标志着平面工艺节点的10年历史终于落幕。2015年，三星在Exynos 7420上使用全新14纳米FinFet技术，台积电紧随其后，推出16纳米FinFet工艺，并搭载于苹果A9芯片。2016年，工艺节点获得进一步完善，成本降低，产量增加。步入2017年， 10纳米工艺节点也不再是梦想。

从GPU的角度看，工艺节点技术的进步对整个行业意义非凡。首先，工艺节点越先进，单位区域（或功耗）的晶体管密度就越大。GPU属于并行处理器，只要架构扩展，性能就会随之提升。然而，先进工艺节点对布线的扩展效果不如晶体管。恰恰相反，Ergo 工艺制程从28纳米优化至14纳米，SoC设计师得以实现更高的晶体管密度，但却不如布线的扩展。这意味着，如果设计10纳米GPU时采用与28纳米同样的方法，设计结果必然会打折扣，因为晶体管和布线各有权衡，不尽相同。设计师常常需要妥协，使IP适应某个节点，这种权衡随着先进工艺节点数量的增加变得愈加重要。

深入探讨高端移动GPU的性能如何继续提高之前，我们需要特别指出GPU性能从2011年到2016年提升了20倍这个有趣的事实。由于手机同时变得更加轻薄，因此该数字并不能代表技术进步的全景，但现代移动设备开发商对性能提升的渴求已经可见一斑。

移动设备开发商不断完善现有用例，开发颠覆性的新用例，以保持创新节奏，并从新一轮的性能升级中获益。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/dianzi/2530689.html

应对下一代移动图形处理的挑战

发表评论

评论列表（0条）