目前中大型服务器采用的CPU是intel还是AMD,能具体分析一下优劣么?

目前中大型服务器采用的CPU是intel还是AMD,能具体分析一下优劣么?,第1张

额,貌似都不是,现在的话大中型服务器一般都是IBM或者SUN的服务器,基本和英特尔,AMD没什么关系。毕竟在技术上这两家除了惠普和英特尔的安腾以前还有一战之力,AMD在中高端基本完败。英特尔的话在中高端貌似也搞不过这两家,基本上大部分大型企业或者政府机构都是IBM的POWER处理器或者SUN的SPARC64 处理器。基本上这两家在民用级市场上呼风唤雨的大佬在高端上面还是哪里凉快哪里呆着

根据你个人对电脑用途的要求,
AMD:在支持3D游戏方面比Intel出色,AMD CPU支持3D Now!指令集而Intel 不支持该指令。如果你是学生或比较爱玩游戏的用户的话,建议你使用AMD系列的CPU,性价比比较高。
Intel:这当然是个响当当的牌子,不光广告做得大,其实质量也不错啦,只是价格嘛。。。当然就要多掏点银子啦。不得不承认Intel在多线程处理方面的强大能力,在应用多媒体方面也是一大优势,应该说综合实力比较强。如果你是多媒体处理或商业方面的用户的话,建议你使用Intel系列的CPU,求的是综合性能与稳定性。

AMD是一家专注于微处理器设计和生产的跨国公司,总部位于美国加州硅谷内森尼韦尔。AMD为电脑、通信及消费电子市场供应各种集成电路产品,其中包括中央处理器、图形处理器、闪存、芯片组以及其他半导体技术。
公司概览 创始人:杰瑞·桑德斯(Jerry Sanders ) 前任董事会主席:鲁毅智(Hector de JRuiz) 现任董事会主席:迪克·梅耶(Dirk Meyer) 大中华区总裁:郭可尊 AMD(Advanced Micro Devices)的英文缩写,超微半导体 注释:Advanced为先进的,Micro为微小之意,英文直译为先进微半导体,但是AMD公司为自己的中文命名是超威半导体,所以也可称为超微半导体(这里使用的是官方说法) 。AMD成立于1969 年,总部位于加利福尼亚州桑尼维尔。 AMD 公司专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器、闪存和低功率处理器解决方案。AMD 致力为技术用户——从企业、政府机构到个人消费者——提供基于标准的、以客户为中心的解决方案。其在CPU市场上的占有率仅次于Intel。 AMD 在全球各地设有业务机构,在美国、中国、德国、日本、马来西亚、新加坡和泰国设有制造工厂,并在全球各大主要城市设有销售办事处,拥有超过 16万名员工。 2009 年, AMD 的销售额是54亿美元。 AMD 有超过 70% 的收入都来自于国际市场,是一家真正意义上的跨国公司。公司在美国纽约股票交易所上市,代号为 AMD。
[编辑本段]业务发展
在 AMD,坚持“客户为本 推动创新”的理念,这是指导 AMD 所有业务运作的核心准则。 AMD与客户建立了成功的合作关系,以便更加深入地了解他们的需求;AMD与技术领袖开展了密切的合作,以开发下一代解决方案,拓展全球市场和推广 AMD 的品牌;我们还与一些以克服艰巨困难并依靠技术获得成功的世界级领先者建立了合作关系。 迄今为止,全球已经有超过 2,000 家软硬件开发商、 OEM 厂商和分销商宣布支持AMD64位技术。在福布斯全球 2000 强中排名前 100 位的公司中,75% 以上在使用基于 AMD 皓龙(TM) 处理器的系统运行企业应用,且性能获得大幅提高。
[编辑本段]产品系列
计算产品
对于需要高性能计算和 IT 基础设施的企业用户来说, AMD 提供一系列解决方案。 o 1981年,AMD 287 FPU ,使用Intel 80287核心。产品的市场定位和性能与Intel 80287基本相同。也是迄今为止AMD公司 唯一生产过的FPU产品,十分稀有。 o AMD 8080(1974年)、8085(1976年)、8086(1978年)、8088(1979年)、80186(1982年)、80188、80286微处理器,使用Intel 8080核心。产品的市场定位和性能与Intel同名产品基本相同。 o AMD 386(1991年)微处理器,核心代号P9,有SX和DX之分,分别与Intel 80386SX和DX相兼容的微处理器。AMD 386DX与Intel 386DX同为32位处理器。不同的是AMD 386SX是一个完全的16位处理器,而Intel 386SX是一种准32位处理器----内部总线32位,外部16位。AMD 386DX的性能与Intel 80386DX相差无己,同为当时的主流产品之一。AMD也曾研发了386 DE等多种型号基于386核心的嵌入式产品。 o AMD 486DX(1993年)微处理器,核心代号P4,AMD自行设计生产的第一代486产品。而后陆续推出了其他486级别的产品,常见的型号有:486DX2,核心代号P24;486DX4,核心代号P24C;486SX2,核心代号P23等。其它衍生型号还有486DE、486DXL2等,比较少见。AMD 486的最高频率为120MHz(DX4-120),这是第一次在频率上超越了强大的竞争对手Intel。 o AMD 5X86(1995年)微处理器,核心代号X5,AMD公司在486市场的利器。486时代的后期,TI(德州仪器)推出了高性价比的TI486DX2-80,很快占领了中低端市场,Intel也推出了高端的Pentium系列。AMD为了抢占市场的空缺,便推出了5x86系列CPU(几乎是与Cyrix 5x86同时推出)。它是486级最高频的产品----334、133MHz,035微米制造工艺,内置16KB一级回写缓存,性能直指Pentium75,并且功耗要小于Pentium。 o AMD K5(1997年)微处理器,1997年发布。因为研发问题,其上市时间比竞争对手Intel的"经典奔腾"晚了许多,再加上性能并不十分出色,这个不成功的产品一度使得AMD的市场份额大量丧失。K5的性能非常一般,整数运算能力比不上Cyrix x86,但比"经典奔腾"略强;浮点预算能力远远比不上"经典奔腾",但稍强于Cyrix 6x86。综合来看,K5属于实力比较平均的产品,而上市之初的低廉的价格比其性能更加吸引消费者。另外,最高端的K5-RP200产量很小(惯例吧:)并且没有在中国大陆销售。 o AMD K6(1997年)处理器是与Intel PentiumMMX同档次的产品。是AMD在收购了NexGen,融入当时先进的NexGen 686技术之后的力作。它同样包含了MMX指令集以及比Pentium MMX整整大出一倍的64KB的L1缓存!整体比较而言,K6是一款成功的作品,只是在性能方面,浮点运算能力依旧低于Pentium MMX。 o K6-2(1998年)系列微处理器曾经是AMD的拳头产品,现在我们称之为经典。为了打败竞争对手Intel,AMD K6-2系列微处理器在K6的基础上做了大幅度的改进,其中最主要的是加入了对"3DNow!"指令的支持。"3DNow!"指令是对X86体系的重大突破,此项技术带给我们的好处是大大加强了计算机的3D处理能力,带给我们真正优秀的3D表现。当你使用专门"3DNow!"优化的软件时就能发现,K6-2的潜力是多么的巨大。而且大多数K6-2并没有锁频,加上025微米制造工艺带给我们的低发热量,能很轻松的超频使用。也就是从K6-2开始,超频不再是Intel的专有名词。同时,K62也继承了AMD一贯的传统,同频型号比Intel产品价格要低25%左右,市场销量惊人。K6-2系列上市之初使用的是"K6 3D"这个名字("3D"即"3DNow!"),待到正式上市才正名为"K6-2"。正因为如此,大多数K6 3D为ES(少量正式版,毕竟没有量产:)。K6 3D曾经有一款非标准的250MHz产品,但是在正式的K6-2系列中并没有出现。K6-2的最低频率为200MHz,最高达到550MHz。 o AMD于1999年2月推出了代号为"Sharptooth"(利齿)的K6-3(1998年)系列微处理器,它是AMD推出的最后一款支持Super架构和CPGA封装形式的CPU。K6-3采用了025微米制造工艺,集成256KB二级缓存(竞争对手Intel的新赛扬是128KB),并以CPU的主频速度运行。而曾经Socket 7主板上的L2此时就被K6-3自动识别为了L3,这对于高频率的CPU来说无疑很有优势,虽然K6-3的浮点运算依旧差强人意。因为各种原因,K6-3投放市场之后难觅踪迹,价格也并非平易近人,即便是更加先进的K6-3+出现之后。 oAMD于2001年10月推出了K8架构。尽管K8和K7采用了一样数目的浮点调度程序窗口(scheduling window ),但是整数单元从K7的18个扩充到了24个,此外,AMD将K7中的分支预测单元做了改进。global history counter buffer(用于记录CPU在某段时间内对数据的访问,称之为全历史计数缓冲器)比起Athlon来足足大了4倍,并在分支测错前流水线中可以容纳更多指令数,AMD在整数调度程序上的改进让K8的管线深度比Athlon多出2级。增加两级线管深度的目的在于提升K8的核心频率。在K8中,AMD增加了后备式转换缓冲,这是为了应对Opteron在服务器应用中的超大内存需求。 oAMD于2007下半年推出K10架构。 采用K10架构的 Barcelona为四核并有463亿晶体管。Barcelona是AMD第一款四核处理器,原生架构基于65nm工艺技术。和Intel Kentsfield四核不同的是,Barcelona并不是将两个双核封装在一起,而是真正的单芯片四核心。 ● Barcelona新特性解析:引入全新SSE128技术 Barcelona中的一项重要改进是被AMD称为“SSE128”的技术,在K8架构中,处理器可以并行处理两个SSE指令,但是SSE执行单元一般只有64位带宽。对于128位的SSE *** 作,K8处理器需要将其作为两个64位指令对待。也就是说,当一个128位 SSE指令被取出后,首先需要将其解码为两个micro-ops,因此一个单指令还占用了额外的解码端口,降低了执行效率。 而Barcelona加宽了执行单元从64位到128位,所有128位的SSE *** 作不再需要进行解码分解为两个64位 *** 作,并且浮点调度器也可以支持这种128位 SSE *** 作,提高了执行效率。 提高SSE指令执行单元带宽的同时,也会带来一些新的变化,也可以说是新的瓶颈:指令存取带宽。为了将并行处理器过程中解码数量最大化,Barcelona开始支持32字节每时钟周期的指令存取,而先前K8架构只支持16字节。32字节的指令存取带宽不仅对处理器SSE代码有帮助,同时对于整数指令也有效果。 ● Barcelona新特性解析:内存控制器再度强化 当年当AMD将内存控制器集成至CPU内部时,我们看到了崭新而强大的K8构架。如今,Barcelona的内存控制器在设计上将又一次极大的改进其内存性能。 Intel Xeon服务器所有使用的FB-DIMM内存一大优势是,可以同时执行读和写命令到AMB,而在标准的DDR2内存中,你只能同时进行一个 *** 作,而且读和写的切换会有非常大的损失。如果是一连串的随机混合执行的话,将会带来非常严重的资源浪费,而如果是先全部读然后再转换到写的话,就可以避免性能的损失。K8内存控制器就采用读取优先于写的策略来提高运行效率,但是Barcelona则更加智能化。 但是读取的数据会被先存放在buffer中,而不采用先直接执行写,但当它的容量达到了极限就会溢出,为了避免这种情况,在此之前才对读写之间进行切换,同时可以带来带宽和延迟方面效率的提高。K8核心配备的是128-bits宽度的单内存控制器,但是在Barcelona中,AMD把它分割成两个64-bit,每个控制器可以独立的进行 *** 作,因此它可以带来效率上的不小提升,尤其是在四核执行的环境下,每个核心可以独立占有内存访问资源。 Barcelonas中集成的北桥部分(注意不是主板北桥)也被设计成更高的带宽,更深的buffers将允许更高的带宽利用率,同时北桥自身已经可以使用未来的内存技术,比如DDR3。 内存控制器的预取功能是运用相当广泛、十分重要的一项功能。预取可以减少内存延迟对整体性能的负面影响。当NVIDIA发布nForce2主板时,重点介绍的就是nForce2芯片组的128位智能预取功能。Intel在发布Core 2处理器之时也强调了CORE构架每核心拥有三个预取单元。 K8构架中每个核心设计有2个预取器,一个是指令预取器,另一个是数据预取器。K8L构架的Barcelona保持了2个的数量,但在性能上有了较大的改进。一个明显的改进是数据预取器直接将数据寄存入L1缓存中,相比K8构架中寄存入L2缓存的做法,新的数据预取器准确率更高,速度更快,内存性能及CPU整体性能将得益于此。 ● Barcelona新特性解析:创新——三级缓存 受工艺技术方面的影响,AMD处理器的缓存容量一直都要落后于Intel,AMD自己也清楚自己无法在宝贵的die上加入更多的晶体管来实现大容量的缓存,但是勇于创新的AMD却找到了更好的办法——集成内存控制器。 处理器整合内存控制器可以说是一项杰作,拥有整合内存控制器的K8构架仅依靠512KB的L2缓存就能够击败当时的对手Pentium 4。直到现在的Athlon 64 X2也依然保持着Intel 2002年就已过时的512KB L2缓存。 现在Core 2已经拥有了4MB的L2缓存,看来Intel和AMD之间的缓存差距还将保持,因为Barcelona的L2缓存依然是512KB。相比之下,Intel四核的Kentsfield芯片拥有8MB的L2缓存,而2007年末上市的新型Penryn芯片将拥有12MB的L2缓存。 Barcelona的缓存体系和K8构架有一定的相似之处,它的四颗核心各拥有64KB的L1缓存和512KB的L2缓存。从简化芯片设计的角度来看,四核心共享巨大的L2缓存对K8L构架而言并不合适,所以AMD引入了L3缓存,得益于65nm工艺,Barcelona在一颗晶圆上集成四颗核心外,还集成了一块2MB容量的L3缓存。也就是说L3缓存与4颗内核同样原生于一块晶圆,其容量为最小2M起跳。同L2缓存一样,L3缓存也是独立的,L1缓存的数据和L3缓存的数据将不会重复。 Barcelona的缓存工作原理是:L2缓存是作为L1缓存的备用空间。L1缓存储存着CPU当前最需要的数据,而当空间不足时,一些不是最重要的数据就转移到L2缓存中。而当未来再次需要时,则从L2缓存中再次转移到L1缓存中。新加入的L3缓存延续了L2缓存的角色,四颗核心的L2缓存将溢出的数据暂时寄存在L3缓存中。 L1缓存和L2缓存依然分别是2路和16路,L3缓存则是32路。快速的32路L3缓存不仅可以更好的满足多任务并行,而且对单任务的执行也有着较大积极作用。尤其在3D运用方面,2MB的L3缓存将对性能产生极大的推进作用。 AMD全新45nm的Shanghai架构 2008年11月13日,AMD公司宣布其代号为“上海”的新一代45nm四核皓龙处理器已经广泛上市。“上海”性能最高提升达35%,而空载时的功耗可显著降低35%。新一代四核AMD皓龙处理器采用创新的设计,能够带来更高的虚拟化性能和每瓦性价比,帮助数据中心提高效率,降低复杂性,从而最大限度地满足IT管理者的需要,以更低的投入实现更高的产出。 AMD公司负责计算解决方案业务的高级副总裁Randy Allen表示:“新一代四核AMD皓龙处理器是在正确的时间诞生的一款正确的产品。堪称完美的提前推出,使之成为x86服务器性能的新王者。通过与OEM厂商和解决方案供应商等合作伙伴的紧密合作,AMD的创新技术在满足企业用户目前最基本需求的同时,还为其未来发展做好准备。自4年前AMD推出世界首款x86双核处理器以来,这一增强的新一代皓龙处理器带来了AMD产品性能和每瓦性价比的最大提升。” 领先的性能满足当今最迫切的商务需求 数据中心的管理者们面对日益增长的压力,诸如网络服务、数据库应用等的企业工作负载对计算的需求越来越高;而在当前的IT支出环境下,还要以更低的投入实现更高的产出。迅速增长的新计算技术如云计算和虚拟化等,在今年第二季度实现了60%的同比增长率3,这些技术在迅速应用的同时也迫切需要一个均衡的系统解决方案。最新的四核AMD皓龙处理器进一步增强了AMD独有的直连架构优势,能够为包括云计算和虚拟化在内的日渐扩大的异构计算环境提供具有出色稳定性和扩展性的解决方案。 卓越的虚拟化性能 具有改进的AMD直连架构和AMD虚拟化技术(AMD-V(TM)),45nm四核皓龙处理器成为已有的基于AMD技术的虚拟化平台的不二选择,目前全球的OEM厂商已基于上一代AMD四核皓龙处理器推出了9款专门为虚拟化应用而设计的服务器。新一代处理器可提供更快的虚拟机转换时间,并优化快速虚拟化索引技术(RVI)的特性,从而提高虚拟机的效率,AMD的AMD-V(TM)还可以减少软件虚拟化的开销。 无与伦比的性价比 与历代的AMD皓龙处理器相比,新一代四核皓龙处理器带来了前所未有的性能和每瓦性能比显著增强,包括: o 以与上代四核皓龙处理器相同的功耗设计,大幅提高CPU时钟频率。这得益于处理器设计增强、AMD业界领先的45nm沉浸式光刻技术和超强的处理器设计与验证能力。 o L3缓存容量提高200%,达到6MB,增强虚拟化、数据库和Java等内存密集型应用的性能。 o 支持DDR2-800内存,与现有AMD皓龙处理器相比内存带宽实现了大幅提高,并且比竞品使用的Fully-Buffered DIMM具有更高的能效。 o 即将推出的超传输总线(TM)30 (HyperTransport(TM) 30)技术将进一步增强AMD革命性的直连架构,计划于2009年2季度将处理器之间的通信带宽提高到176GB/s。 无可匹敌的节能特性 AMD皓龙处理器业已带来了业界领先的X86服务器处理器每瓦性价比,与之相比,新一代45nm四核AMD皓龙处理器在空载状态的能耗可以大幅降低35%,而性能可提高达35%。“上海”采用了众多的新型节能技术:AMD智能预取技术,可允许处理器核心在空载时进入“暂停”状态,而不会对应用性能和缓存中的数据有任何影响,从而显著降低能耗;AMD CoolCore(TM) 技术能够关闭处理器中非工作区域以进一步节省能耗。 在平台配置相似的情况下,基于75瓦AMD 四核皓龙处理器的平台,与基于50瓦处理器的竞争平台相比,具有高达30%的每瓦性能比优势。相似平台配置下,基于AMD 四核皓龙处理器2380的平台,空载状态的功耗为138瓦;与之对比,基于英特尔四核处理器的平台在相同状态下的功耗则为179瓦。基于AMD 四核皓龙2380型号处理器的平台,在SPECpower_ssj(TM)2008基准测试中取得761ssj_ops/每瓦的总成绩 (308,089 ssj_ops @ 100% 的目标负载),而英特尔四核平台为总成绩为561ssj_ops/每瓦 (267,804 ssj_ops @ 100%的目标负载) 4 前所未有的平台稳定性 作为唯一用相同的架构提供2路到8路服务器处理器的x86微处理器制造商,AMD新一代45nm四核皓龙处理器在插槽和散热设计与上代四核和双核AMD皓龙处理器兼容,延续了AMD的领先地位。这可以帮助消费者减少平台管理的复杂性和费用,增强数据中心的正常运行时间和生产力。新的45nm处理器适用于现有的Socket 1207插槽架构,未来代号为“Istanbul”的AMD 下一代皓龙处理器也计划使用相同插槽。 全球OEM 厂商支持 作为业内最易于管理和一致的x86服务器平台,由于采用AMD皓龙处理器,至少是部分原因,全球OEM和系统开发商能够迅速完成验证流程,并预计从本月起开始交付基于增强的四核AMD皓龙处理器的下一代系统。本季度和2009年第一季度,基于增强的四核AMD皓龙处理器的系统的供应量有望迅速增长。 惠普工业标准服务器业务部营销副总裁Paul Gottsegen 表示:“通过采用基于新 ‘上海’处理器的 HP ProLiant服务器,客户可以降低成本,同时使能效和性能更上层楼。在与AMD公司过去的4年合作中,我们为各种规模的客户提供了基于AMD皓龙处理器的平台,并取得了空前的成功。初期反馈结果表明‘上海’将成为赢者。” Sun公司系统业务部执行副总裁John Fowler 表示:“ Sun的创新系统设计和Solaris与增强型四核AMD皓龙处理器相结合,将为虚拟化应用和系统整合带来具有难以置信的强大性能、可扩展性和高能效特性的x64平台。在数据中心增长过程中,基于AMD增强型四核皓龙处理器的Sun服务器能够处理最复杂的数据群并灵活扩展。而由于历代平台之间的连续性,客户有信心确保新系统与已部署的AMD皓龙系统实现无缝兼容。” 戴尔商用产品部高级副总裁Brad Anderson表示:“戴尔和AMD公司共同致力于为企业提供强大的全系列产品,以简化IT环境管理并降低管理成本。我们的PowerEdge服务器专门设计以充分利用AMD芯片中集成的虚拟化特性。这种紧密协作效果显著,2路和4路机架和刀片式PowerEdge服务器已经取得了破纪录的虚拟化性能。” IBM刀片式服务器副总裁Alex Yost表示:“自2003年以来,IBM就利用AMD皓龙处理器的性能和直连架构满足企业用户计算密集型的需求,并为其带来更多选择。IBM正在AMD新处理器高能效和虚拟化的基础上进一步创新,为我们的客户带来更高的价值。” o 采用直连架构的 AMD 皓龙(Opteron)(TM) 处理器可以提供领先的多技术。 使IT管理员能够在同一服务器上运行32位与64位应用软件,前提是该服务器使用的是64位 *** 作系统。 o AMD 速龙(Athlon64),又叫阿斯龙(TM) 64 处理器可以为企业的台式电脑用户提供卓越的性能和重要的投资保护,具有出色的功能和性能,可以提供栩栩如生的数字媒体效果――包括音乐、视频、照片和 DVD 等。 o AMD 双核速龙(TM) 64(AthlonX2 64 )处理器可以提供更AMD双核速龙64处理器架构高的多任务性能,帮助企业在更短的时间内完成更多的任务(包括业务应用和视频、照片编辑,内容创建和音频制作等)。这些强大的功能使其成为那些即将上市的新型媒体中心的最佳选择。 o AMD 炫龙(TM) 64(Turion64) 移动计算技术可以利用移动计算领域的最新成果,提供最高的移动办公能力,以及领先的 64 位计算技术。 o AMD 闪龙(TM)(Sempron64) 处理器不仅可以为企业提供出色的性价比,而且可以提高员工的日常工作效率。 o AMD 羿龙(TM)(phenom)处理器 全新架构的4核处理器,进一步满足用户需求(在命名中取消“64”,因为现今的CPU都是64位的,不必再标明)。为满足消费者的不同需求,AMD近期也推出了3核羿龙产品! 对于消费者, AMD 也提供全系列 64 位产品。 o AMD 雷鸟(TM) (Thunderbird)处理器 o AMD 钻龙(TM) (Duron)处理器可以说是雷鸟的精简便宜版,架构和雷鸟处理器一样,其差别除了时脉较低之外,就是内建的L2 Cache,只有64K 。
嵌入式解决方案
AMD 的嵌入式解决方案以个人电脑以外的上网设备为目标市场,锁定的目标产品包括平板电脑、汽车导航及娱乐系统、家庭与小型办公室网络产品以及通信设备。AMD Geode(TM) 解决方案系列不仅包括基于x86的嵌入式处理器,还包括多种系统解决方案。AMD 的一系列 Alchemy(TM) 解决方案有低功率、高性能的 MIPS(TM) 处理器、无线技术、开发电路板及参考设计套件。随着这些新的解决方案相继推出,AMD 的产品将会更加多元化,有助确立 AMD 在新一代产品市场上的领导地位。
自1969年推出产出第一个优良芯片--Am9300开始,创新推动着AMD不断向前。2003年,AMD首开先河推出了高性能和无缝移植32位,拥有强大的64位计算优势的AMD64技术;在合作伙伴的支持下,AMD率先在中国个人电脑市场推出64位计算。2005年,AMD再开行业之先河,推出了基于直联架构的双核心处理器。 进入2007年,AMD的创新劲头更加势不可挡。3月,首款AMD 690系列芯片组出炉;第二季度,AMD全线采用65纳米制造工艺;6月,AMD通过ATI Radeon HD 2000系列图形显示芯片,进一步确立了整合开放平台技术的领先优势。同年,AMD推出业界首款真四核产品--四核皓龙处理器"巴塞罗那",并发布真四核台式羿龙处理器和Spider(蜘蛛)全新高端平台,再次引领真四核计算的新纪元。 2008年,AMD先后推出数十款处理器产品和平台解决方案,稳立行业创新浪尖。6月,AMD发布全新移动平台PUMA,通过AMD移动处理器, AMD 780G高端芯片组 和ATI Radeon 图形显示芯片的结合,以完美的三维和高清性能表现,打造了极致视觉体验。7月,AMD同曙光再次联手,推出了基于AMD四核皓龙处理器的中国首款超百万亿次超级计算机曙光5000A,并跻身全球超级计算机排行榜前十。而羿龙三核/四核台式处理器的推出更是赢得了零售市场和OEM合作伙伴的广泛欢迎。同年年末,AMD更是推出了业界领先的45nm四核皓龙处理器"上海",引领整个行业走入一个全新的计算时代。 AMD 多年来一直致力投资开发未来一代的先进技术。2009年伊始,在台式机方面,AMD便推出了下一代45nm四核处理器Phenom II处理器与高端"Dragon"3A平台;在移动平台方面,AMD推出了超便携平台Yukon,还计划推出Congo, 此外将陆续推出下一代主流移动平台"Tigris",六核服务器处理器""Istanbul"和第一个AMD服务器平台"Fiorano";而在图形显示方面,AMD也将向DirectX 11迁移。 目前 AMD 已着手开发未来 5 至 10 年都可适用的高性能技术。在全新的Fusion品牌理念的指导下,AMD将通过展现芯片级融合概念的创新技术,加强与客户及合作伙伴密切合作,向全球用户提供无与伦比的体验和差异化服务,从而使整个行业呈现全新面貌。

做服务器的用INTEL的CPU。因为服务器讲究的是稳定安全。
还有谦容性。而INTEL的CPU就是有这些功能。
它的兼容性和稳定性远远比AMD的CPU强多了。AMD的CPU主要是做浮点运算的。玩游戏最佳选择。它讲究的速度。可能随机会关机重启。如果服务器随机关机重启的话麻烦就大了。慎重建议你选择INTEL的CPU做服务器。不然你会吃大亏

Intel:
台式机 赛扬系列(赛扬D),奔腾系列(奔腾4,奔腾D),酷睿系列,酷睿2系列
笔记本 赛扬M系列(赛扬M(Dothan),赛扬M(Yonah),赛扬M(64位)),迅驰系列(奔腾M,奔腾M(Dothan)),酷睿系列(双核酷睿,单核酷睿),酷睿2系列
服务器 至强系列
AMD:
台式机 闪龙系列,速龙系列
笔记本 炫龙系列(单核炫龙,双核炫龙),移动闪龙系列(32位闪龙,64位闪龙),移动速龙系列(64位速龙)
服务器 皓龙系列

近年来,在服务器和数据中心等企业级市场,AMD凭借持续更新的“Zen”架构,其EPYC(霄龙)系列处理器的市场占有率上升势头非常迅猛。2022年11月,AMD推出全新第四代EPYC处理器。新处理器将单插槽处理器核心数量提升到最多96核,并且采用了最新的“Zen 4”架构,带来大量全新特性。接下来,本文就对第四代EPYC处理器进行详细解读。
第四代EPYC处理器:EPYC 9004系列登场
在解析AMD第四代EPYC处理器的架构之前,我们先来梳理一下它的型号定义,因为在这方面它与上代产品存在显著差异。
此前,AMD采用EPYC 7000系列作为原始命名。最后一位数代表不同代次,比如EPYC 7001、EPYC 7002和EPYC 7003就分别代表三代不同的产品,其中又包含大量细分型号。在第四代EPYC处理器上,AMD改用了EPYC 9004作为产品基础代号,这可能是考虑到本代产品具备极为显著的性能提升。同时,在大多数人的概念中,“9”相比“7”显得定位更高、性能更强。第二位数字代表处理器核心数量,其基本对应关系如下表:

第三位数字代表性能情况,数字越大则性能越强,目前由2~7的不同数字组成。如果AMD愿意,未来还可能进一步扩展到9。最后一位数字则固定为“4”,代表第四代EPYC处理器。
打开APP查看高清大图
▲AMD详细解读了EPYC 9004产品命名情况
打开APP查看高清大图
▲AMD将EPYC 9004产品分为了三类:追求核心密度的产品、追求平衡和优化的性能的产品以及追求核心性能的产品。
AMD本次发布了18款EPYC 9004系列处理器,分为3个大类,分别是追求核心密度的产品、追求平衡和优化的性能的产品以及追求核心性能的产品,具体规格见下表。
打开APP查看高清大图
打开APP查看高清大图
▲EPYC 9004、EPYC 7003、英特尔第12代酷睿、锐龙7000以及英特尔第11代酷睿处理器(从左到右)的外观对比,可以看到EPYC 9004大了不少。
计算和扩展的领先地位:EPYC 9004技术架构一览
毫不夸张地说,EPYC 9004是目前市面上最先进的企业级产品之一。它在CPU架构、Chiplet应用以及互联方式上,几乎都是当前技术条件下所能达到的极致。这一次,AMD在超大规模的企业级产品研发上进入了一个新的层次,短时间内,能超越它的只有AMD自己的下一代产品。
设计目标:拥有扩展和计算性能的优势地位

▲AMD EPYC 9004的设计理念
按照惯例,我们先来看看EPYC 9004的设计理念和实现情况。AMD EPYC 9004的设计理念就是继续保持计算性能和扩展能力的优势地位。AMD分四个方面进行了阐述:首先是拥有最先进的单核心性能和单插槽性能,这依靠最新的Zen 4架构和5nm工艺实现;其次是配备超大的内存带宽和容量,这依靠12通道的DDR5内存来实现;第三是采用全新的下一代IO接口,这包括最大160通道的PCIe 50控制器以及可以利用CXL协议扩展的内存寻址功能等;第四则是加密计算方面的新进展,主要通过CXL以及2倍的SEV-SNP功能来实现。

▲EPYC 9004和上代产品的性能比较情况
根据AMD官方数据显示,和EPYC 7003系列的顶级型号EPYC 7763相比,EPYC 9004系列中的顶级型号EPYC 9654能够在云端、HPC和企业级性能方面分别领先107%、123%以及94%。AMD宣称第四代EPYC处理器是全世界最好的数据中心处理器,拥有最快的数据中心性能、领先的能源效率、优秀的TCO表现、安全的加密计算能力以及丰富的生态系统。

▲AMD EPYC 9004的宏观布局
为了达到这些设计要求,EPYC 9004在结构上依旧采用了Chiplet设计,布局在中间的是全新设计的IO芯片,周围的CCD单元数量增加到12个。每个CCD中依旧包含了8个CPU核心和相应的缓存,以及32MB L3缓存。EPYC 9004核心数量大增的原因是CCD数量从上代产品的最多8个增加到了最多12个,这使得它最多能提供96核心192线程。
Zen 4架构:IPC提升14%
AMD在企业级产品和消费级产品上采用了同样的核心微架构:EPYC 9004和桌面锐龙7000系列都是最新的Zen 4架构。有关Zen 4架构,本刊在之前锐龙7000首发文章中曾有过介绍,本文再简单回顾一下。

▲Zen 4微架构及改进一览
AMD Zen 4架构是基于Zen 3架构改进而来,在架构设计上,AMD希望实现更高的性能、更低的延迟和更好的能效比。其中性能的提升来自频率和IPC的提升;更低的延迟主要是提升了缓存的性能并且降低了整个架构的平均延迟;能效比方面则通过新设计、新工艺以及将移动端的一些技术移植在桌面端,降低了整个CPU的动态功耗。

▲Zen 4架构相比Zen 3架构的重要提升
具体来看,Zen 4架构在分支预测、Op缓存、指令排序相关窗口、整数或浮点寄存器、每核心更深的缓冲区、后端读取和加载等方面进行了优化。特别的变化是另外加入对AVX-512指令集的支持,以及重新调整的每核心1MB、8-way L2缓存。
前端方面,分支预测部分有大幅加强。AMD使用了一个更强有力的分支预测单元,每周期可以执行2次分支预测。此外,L1分支目标缓冲区的容量提升了50%,达到15K条目,L2分支目标缓冲区则达到7K。Zen 4还拥有更大的Op缓存、更大的指令回写队列,它们在很大程度上提升了处理器的前端性能。
执行单元部分,Zen 4没有提升执行单元的数量,而是持续增大重排缓冲区。它增加了浮点/整数寄存器的体积,整数从192增加至224,浮点从160增加至192,核心缓冲区达到320条目。执行单元方面依旧是每周期10个INT和6个FP。
后端的读取和加载部分,Zen 4拥有更大的读取排序单元,更少的缓存端口冲突以及增大50%的L2 DTLB。另外依旧拥有每周期3个内存 *** 作,最多每周期3个读取和2个写入。
缓存方面,最明显的改变是每个核心的L2缓存翻倍到1MB,这样可以降低CPU核心的未命中率并提升命中率,同时也降低了从L3和内存读取数据的几率。但是由于L2缓存增大,延迟也相应提升,L2和L3的延迟分别增加到最多14个周期和最多50个周期。

▲AMD在Zen 4上设计了全新的AVX-512引擎,和英特尔的路线有巨大差异。
在指令集方面,Zen 4实现了对AVX-512指令集的支持。Zen 4采用了2个AVX 256来合并执行1个AVX-512,而英特尔采用了独立的AVX512 SIMD核心。AMD的设计可以节省晶体管资源,并且不需要降低频率来运行AVX-512。但是当同时执行AVX2和AVX-512的时候,则必须完成一个后再执行另一个。AVX-512比之前Zen架构多核心执行FP32的工作效能提升了30%。此外,Zen 4也实现了对BF16数据格式的支持,这是AI计算中新兴的一种重要数据格式。

▲在启用AVX-512后,相关性能得到了巨大提升。
根据AMD官方数据显示,在支持AVX-512后,使用2路EPYC 9654(192核心)对比2路EPYC 7763(128核心),在NLP、图像识别以及物体检测的吞吐量测试中,前者的领先幅度分别达到42倍、3倍和35倍。
AMD还给出了Zen 4相比Zen 3的性能改进情况。总的来看,Zen 4有大约14%的IPC提升。其中贡献最大的是前端的改进,其次是存储和加载部分,再次是分支预测部分,执行部分和L2部分的改进带来的性能增幅则相对较小。在发布锐龙7000系列的时候,AMD给出的IPC提升数据是13%,所以这里提到的14%应该是根据服务器所面向的不同负载重新测试而来。

▲AMD Zen 4架构在服务器端取得了14%的IPC提升
最后再来看看安全方面的内容。Zen 4架构目前支持安全加密的虚拟化,包括SEV-ES、SEV-SNP,内存加密支持AES-256-XTS,支持最多1006个加密的客户机以及多主机秘钥SMKE。此外,它还支持虚拟化X2APIC、免SMT攻击和额外的SPEC_CTL功能等。
12通道DDR5内存
每核心带宽至少比上代产品提升50%
所有EPYC 9004系列处理器都支持12通道DDR5内存,相比上代支持的8通道DDR4内存有巨大进步。从内存带宽来看,DDR5的使用在很大程度上缓解了超多核心处理器内存带宽不足的情况。

▲AMD在EPYC 9004上全面启用DDR5内存
举例来说,上代EPYC 7763拥有64个核心128线程,支持8通道DDR4内存,内存总带宽为2048GB/s,平均每核心32GB/s。新一代的EPYC 9654拥有96核心192线程,支持12通道DDR5内存,内存总带宽为4608GB/s,平均每核心48GB/s。EPYC 9654在处理器核心数量更多的情况下,每核心内存带宽提升了50%。如果是48核心或者32核心产品,每核心内存带宽的提升会更大,这为内存带宽敏感型应用带来了极为不错的性能提升空间。

▲EPYC 9004的内存架构和特性一览
从AMD官方给出的实际测试数据来看,EPYC 7003系列的实际内存带宽大约为154GB/s,EPYC 9004则高达356GB/s,是前代产品的大约23倍。延迟方面,由于EPYC 9004支持的DDR5内存容量更大、通道数量更多,因此延迟有所上升。EPYC 9004的SoC延迟大约在73ns左右,设备延迟大约是45ns左右,因此总延迟在118ns左右,而EPYC 7003的对应数据分别是70ns、35ns和105ns。从整体上来看,EPYC 9004的延迟略高,但是考虑到它拥有更大的带宽,这一点是完全可以接受的。

▲EPYC 9004的内存性能情况
在内存容量方面,所有EPYC 9004系列处理器都支持高达6TB容量。不过目前AMD只给出了1DPC(DIMM Per Channel),也就是12个内存通道、12条内存插槽下的配置情况,内存最高支持12通道的DDR5 4800。至于2DPC配置,AMD宣称会在2023年第一季度再公布详细信息。不过考虑到EPYC 9004不小的面积,12通道DDR5内存插槽所占的体积以及接近400W的CPU供电所需要的PCB面积,未来出现24通道、48插槽的2DPC主板的可能性较低,并且6TB内存对大多数应用场景来说已经足够了。

▲EPYC 9004设计有内存分区管理
最后再来看看内存分区。由于EPYC 9004系列处理器的规模很大,因此AMD也提供了NUMA域的管理和设置,使得用户可以在某些情况下对内存和核心进行调配。它包括了NPS1、NPS2和NPS4三种分区方式:NPS1就是整个处理器;NPS2是将处理器分为2个部分,每个部分有6个内存通道和6个GMI3接口;NPS4则是将处理器分为4个部分。
IO芯片和总线连接系统:采用最新的GMI3连接
AMD在EPYC 9004上继续采用大获成功的Chiplet方案。整个处理器除了CCD之外,还有一个IO芯片。EPYC 9004的CCD由台积电5nm工艺制造,这也是首个使用5nm工艺的企业级CPU产品。IO芯片也采用了台积电6nm工艺制造。

▲EPYC 9004架构简图和特性一览
因为EPYC系列一直采用Chiplet方案,因此在CCD和IO芯片之间需要通信协议予以连接。上一代EPYC处理器采用的是GMI2总线,其IO芯片内部有8个GMI2总线端口,因此总共能支持8个CCD单元连接,每个CCD拥有2个GMI总线接口,可以根据需要进行配置。

▲EPYC 9004的Chiplet连接图一览
EPYC 9004升级为GMI3总线。其中Zen 4架构的8个CCD和12个CCD采用的是每个CCD与1个GMI3总线互联,4个CCD架构中每个CCD通过2个GMI3总线进行互联,从而实现


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10642247.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-10
下一篇 2023-05-10

发表评论

登录后才能评论

评论列表(0条)

保存