cuda程序速度与显卡性能的关系

cuda程序速度与显卡性能的关系,第1张

:蓜桷,你把N卡和A卡的SP搞混了吧,N卡的SP叫流处理器,A卡的叫流处理单位。两者是有区别,大概5个流处理单位=1个流处理器。现在分辨率越来越大,512显存也只能是勉强而已,没有什么浪不浪费。GDDR4本来算是个失败的产品,但你说显存类型不重要,那就错了,GDDR5的频率是等效4倍。

做过相关实验,其实opencv对于cuda的优化并不是特别好,也可能是我用的显卡性能不行。实验结果是并没有比cpu快多少。opencv的cuda编程的程序,主要处理时间都浪费在从内存向显存中拷贝数据以及从显存向内存拷贝数据了。要想写出高效的cuda程序,需要注意的东西很多。

CUDA是显卡厂商NVIDIA推出的运算平台,主要运用在显卡方面。

CUDA是NVIDIA的通用并行计算架构,使gpu能够解决复杂的计算问题。它包括CUDA指令集架构(ISA)和GPU内部的并行计算引擎。开发人员可以使用C语言编写CUDA架构的程序,在支持CUDA的处理器上运行超高性能。CUDA3.0已经支持c++和FORTRAN。

发展现况:

支持CUDA的gpu已经售出了超过1亿,成千上万的软件开发人员正在使用免费的CUDA软件开发工具来解决专业和家庭应用中的问题。这些应用范围从视频和音频处理和物理效果模拟到石油和天然气勘探、产品设计、医学成像和科学研究。

CUDA的核心是三个重要的抽象:线程组层次结构、共享存储和barrier同步,这可以很容易地暴露给程序员,作为C语言的最小扩展。

CUDA软件栈由几个层组成,一个硬件驱动程序、一个应用程序编程接口(API)及其运行时,以及两个高级通用数学库CUFFT和CUBLAS。硬件被设计为支持轻量级驱动程序和运行时层,从而提高性能。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/11723947.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-18
下一篇 2023-05-18

发表评论

登录后才能评论

评论列表(0条)

保存