美光7400 NVMe SSD发布,为数据中心带来PCIe 4.0性能

美光7400 NVMe SSD发布,为数据中心带来PCIe 4.0性能,第1张

近日,美光宣布推出采用NVM的Micron 7400 SSD。该系列产品具备业界领先的多种外形规格和PCIe 40性能,并具有卓越的安全性,以满足要求苛刻的数据中心工作负载对于存储的需求。

通过该产品,美光提供了目前最广泛的主流数据中心SSD选择。美光7400 SSD具备7种外形规格,可实现向下一代服务器架构的过渡。

由于数据的快速增长和需要高性能的应用的激增,数据中心不断向前发展。对于处理、分析、保护数据并获取有价值的洞见的需求,推动了数据中心的现代化和进一步的存储创新。

美光 科技 企业副总裁兼存储业务部总经理 Jeremy Werner 表示:“我们的客户需要通过改善存储容量与效率来支持其业务发展。美光 7400 SSD 的灵活性能满足众多应用程序和系统互 *** 作性的需求,实现部署并释放从边缘到云的价值。”

美光7400系列包括业界唯一具备断电保护功能的PCIe 40 M2规格 (22x80mm),以及厚度为15mm和7mm的25英寸U3数据中心SSD。

该系列还具备三种不同尺寸的新型 EDSFF (企业与数据中心存储形态) E1S规格,能实现更大的容量和闪存优化性能,以及改进的功耗与散热选项。

同上一代产品相比,美光7400 SSD的每瓦 IOPS与吞吐量增加了一倍以上。其与PCIe 30系统的向后兼容性有助于缓解客户从30平台到40平台的过渡。

Moor Insights & Strategy 首席分析师 Patrick Moorhead 表示:“美光 7400 SSD 广泛适用于边缘及云部署,其多种全新的外形规格所带来的高性能与效率,以及可防止网络和物理攻击的安全特性,让众多有着独特需求的应用与工作负载均可受益。”

大约一年前,当三星正式推出业界首批Compute Express Link(CXL)内存扩展器时,它主要将其定位为概念验证产品,主要针对未广泛部署的实验性机器。本周,该公司宣布了其CXL内存扩展器20,它携带512GB的DDR5 SDRAM,可以为CPU增加多达16TB的内存。

三星的内存扩展器20是基于该公司的专有控制器,支持CXLmem协议以及PCIe 50接口。相比之下,该公司最初的内存扩展器是基于一个现场可编程门阵列(FPGA)控制器,携带128GB的内存。这两款内存扩展器都采用EDSFF(E3S)的外形尺寸,是为服务器设计的。

三星的内存扩展器20针对的是支持CXLmem协议的下一代服务器,比如那些基于AMD的EPYC 7004系列 "Genoa "和英特尔的Xeon Scalable "Sapphire Rapids "CPU的服务器。由于目前只有英特尔的部分客户可以使用蓝宝石急流处理器,因此对三星内存扩展器20的需求将很难达到。然而,一旦英特尔开始为运行人工智能、大数据和云计算应用的系统大批量交付其蓝宝石急流处理器,对支持CXL的产品的需求应该会大大增加。

除了内存扩展器20之外,三星还打算公布其开源的可扩展内存开发工具包(SMDK)的更新版本,该软件包可以让CXL内存扩展器在异构内存系统中毫不费力地工作。

三星打算在2022年第三季度开始对其内存扩展器20进行采样。该产品的商业出货计划在晚些时候进行,届时基于AMD的Genoa和英特尔的Sapphire Rapids机器将上市。

"CXL DRAM将通过大幅推进人工智能(AI)和大数据服务,成为未来计算结构的关键转折点,因为我们积极扩大其在下一代内存架构(包括软件定义内存(SDM))中的使用,"三星电子内存全球销售和营销副总裁、CXL联盟主任Cheolmin Park说。"三星将继续与整个行业合作,开发和规范CXL内存解决方案,同时培育一个日益稳固的生态系统。"

三星还没有透露任何定价细节,但可以肯定的是,这些产品不会便宜。标准的DDR5内存每32GB DIMM起价超过200美元,相当于每512GB 3,200美元。鉴于内存扩展器20的额外硬件和特殊性质,它的价格几乎肯定会超过这个数字。至于高出多少,还有待观察。也就是说这个产品在国内卖,至少也是几万元的东西。

那跟你能否访问网站没有任何关系。本地iis是测试用的,能否访问网站关乎网络,服务器所在地。等等好多因素,和网站编程asp或者php毛关系都没有,网站编程方式只关系到服务器租用windows还是linux

RDMA实际上是一种智能网卡与软件架构充分优化的远端内存直接高速访问技术,通过将RDMA协议固化于硬件(即网卡)上,以及支持Zero-copy和Kernel bypass这两种途径来达到其高性能的远程直接数据存取的目标。

目前支持RDMA的网卡并不普及,购买网卡时需要跟供应商咨询清楚是否支持此项功能

另外,目前RDMA的硬件实现有3种(如下),也要跟供应商咨询清楚

目前支持RDMA的网络协议有:

InfiniBand(IB): 从一开始就支持RDMA的新一代网络协议。由于这是一种新的网络技术,因此需要支持该技术的网卡和交换机。

RDMA过融合以太网(RoCE): 即RDMA over Ethernet, 允许通过以太网执行RDMA的网络协议。这允许在标准以太网基础架构(交换机)上使用RDMA,只不过网卡必须是支持RoCE的特殊的NIC。

互联网广域RDMA协议(iWARP): 即RDMA over TCP, 允许通过TCP执行RDMA的网络协议。这允许在标准以太网基础架构(交换机)上使用RDMA,只不过网卡要求是支持iWARP(如果使用CPU offload的话)的NIC。否则,所有iWARP栈都可以在软件中实现,但是失去了大部分的RDMA性能优势。

这个功能比较新,我也只是了解了个大概,具体的还是要实践,只能帮你到这里了。

日前,英特尔方面召开2021年度“架构日”活动,一口气公布了多达11项的新产品和新技术。但在当时我们注意到,大多数 科技 媒体都将重点放在了刚刚公布的英特尔ARC(中文名:锐炫)独立显卡上,而对于同台亮相的第12代酷睿Alder Lake处理器的架构信息,却鲜少进行解析。

既然如此,以我们三易生活的风格,当然就要选择“吃螃蟹”,来尝试解析一下英特尔此次公布关于12代酷睿的诸多细节。而事实上,当我们仔细研究了英特尔给出的资料后也发现,英特尔这一次的新架构里,信息量真的很大。


“大小核”正式上位,硬件线程调度器为Win11优化


12代酷睿的产品代号为Alder Lake,其最大的特征就是x86处理器史上首次大规模引入了“大小核”设计。请注意,在这里我们说的是大规模引入,因为此前其实英特尔就已经在10代酷睿产品线里,推出过一款带有“试水”性质的大小核处理器酷睿i5-L16G7。

LakeFiled,英特尔首款“大小核”处理器的代号


当然,以结果来说,酷睿i5-L16G7这款处理器无论市场表现还是用户口碑,都称不上出色。而这很大程度上与它只有“1大核4小核”的配置,以及当时Tremont架构(和现在的赛扬N5095、N6210同架构)小核心不太够用的性能和过低的频率有关。

或许是从酷睿i5-L16G7上吸取了教训,在12代酷睿上,英特尔一方面对大核和小核的架构都进行了重新设计,大幅提高了“能效核心(也就是小核)”的效能;另一方面通过自家的“Intel 7”半导体制程,优化了每一种核心的主频。与初代“大小核”处理器酷睿i5-L16G7相比,12代酷睿目前已知的大核心主频从3GHz提升到了53GHz,小核心主频更是从18GHz提升到了39GHz,所以光是频率所带来的单核性能受益显然就将不容小觑。


当然,最为重要的是,与初代“大小核”相比,12代酷睿此次还大幅增加了核心数量。根据目前已知的信息,12代酷睿的“大小核”配置组合基本如下表所示。

可以看到,除了最低端、功耗等级只有5瓦的超低压型号外,英特尔这一次都大幅增加了“大小核”组合中大核心和小核心的数量。特别是在移动端,几乎清一色都有8个小核心,所以其理论上的多任务性能比现在的4核心低压移动版酷睿,是会强上不少的。

这也就意味着对于12代的酷睿来说,其绝大多数型号(包括移动端和桌面端)都会有超过10个以上的物理核心,同时还是两种不同架构并行运作。那么,这就当然需要进行专门的核心调度优化了。所以英特尔与微软合作,在12代酷睿里集成了一个名为“Intel Thread Director(暂译为英特尔线程导向器)”的硬件单元,并确保Windows 11系统对其提供了原生的兼容性。

根据外媒Anandtech从英特尔方面了解到的信息显示,12代酷睿内部的核心优先级,依次为大核心 小核心 大核心的超线程逻辑核心。而Windows 11系统则会根据当前的功耗和任务繁重情况,自动分派任务给不同级别的核心。


举例而言,当用户在台式机或插电运行的 游戏 本上打 游戏 时,系统就会将重要的任务( 游戏 )优先派给大核心执行,不重要的任务(比如后台杀毒)则交给小核心。而如果笔记本电脑处于低功耗运行的状态下,则轻负载任务启动时,可能会被优先交给小核心,以达到节约电量的目的,此时大核心甚至可以被关闭,就像当下的智能手机上那样。


PCIE50、DDR5首发,12800MHz的内存你怕不怕


说完了12代酷睿的多核心设计,接下来我们谈谈它此次在I/O部分的一些变化。之所以不急着深入解析架构,主要是我们认为I/O部分对于消费者的影响可能还要更大一些。

首先,英特尔此次的确是对12代酷睿的I/O性能进行了极大幅度的升级。一方面,其CPU内部直接集成了16条全新的PCIE 50通道+4条PCIE 40通道;另一方面,与之搭配的芯片组(Z690)也将提供12条PCIE 40和16条PCIE 30。


很显然,英特尔是想要消费者用x16带宽的PCIE 50去安装显卡,直连CPU的x4带宽PCIE 40用于安装主SSD。但从目前的行业状况来看,PCIE 50显卡或许不会那么早推出,但是采用PCIE 50 x4接口,读写速度接近15GB/s的顶级SSD却有可能即将面世。

因此在实际的PC平台上,主板厂商很有可能会将12代酷睿的PCIE 50带宽分成两部分,一半PCIE 50x8的带宽用于连接显卡(正好相当于PCIE40 x16),另一半PCIE 50x8则分解成四条PCIE 40x4,可用于实现板载双万兆网卡、多个直连CPU的PCIE40 M2插槽,或是其他高带宽接口(例如U2、U3、EDSFF等企业级的SSD接口)等等。

其次,在内存子系统上,12代酷睿也成为了消费级平台中第一款支持DDR5内存的平台。根据英特尔方面公布的数据显示,DDR5内存的起始频率为4800MHz,也就是比现在主流的3200MHz DDR4内存快了50%左右。


可能有的朋友看到这里会觉得有些疑惑,明明现在DDR4的高频内存都已经出到DDR4-5400MHz甚至更高了,DDR5起步才4800MHz,性能岂不是在倒退?

别急,英特尔考虑到了这一点。因为在他们所公布的官方信息中声称,12代酷睿的内存带宽可以高达204GB/s。这句话的信息量其实超大,因为大家要知道,这已经相当于顶级的锐龙线程撕裂者PRO平台配备八通道DDR4-3200内存时的带宽了。仅凭12代酷睿的双通道内存控制器,配合DDR5-4800内存是绝对到不了这么高的。

和DDR4时代相比,超高频DDR5内存这次可能会登场得很早


因此可能性就只有一个了,那就是英特尔方面相当于是在明示,已经有内存厂商准备好了等效频率高达12800MHz的DDR5内存,而且它可以兼容12代酷睿,在这个频率下,双通道128bit DDR5的带宽就正好是204GB/s了。当然,从我们三易生活的经验来看,要想让这么高频率的内存稳定运行,不光CPU要支持、主板的用料也不能差,所以204GB/s的超高内存带宽,可能得花不少钱才能体验到了。


大核具备“逆超线程”黑 科技 ,小核性能不输6代酷睿


最后,我们来简单讲一下12代酷睿的内部架构设计。由于这部分的信息量实在太大,所以我们只会选择最重要的部分进行简单分析。


首先,是12代酷睿这一次的大核心架构代号为“Golden Cove”。其实从名称上也能看出,它与11代桌面版的“Cypress Cove”、10代移动版的“Sunny Cove”是一脉相承的。话虽如此,但它本身其实比前两代的变化都要大得多。

比如说,12代酷睿的大核心,首次在x86处理器上实现了6宽度的解码器设计,这意味着它的指令解码能力理论上比之前所有的x86处理器都提升了50%之多。并且与之配合的,则是它的指令缓存、微 *** 作缓存的吞吐量都几乎翻了一番。而为了能够“喂饱”这个超大型的指令解码单元,英特尔更是直接将L2缓存的缓冲区大小从5000条增加到了12000条,同样也成为了当前已知民用级处理器中的最大规模。根据英特尔方面的说法,与前代产品相比,12代酷睿大核心的IPC性能增长了多达19%,这在行业里确实已经算是非常明显的进步了。

然而,这还不是12代酷睿大核心最“黑 科技 ”的设计。还记得我们在前文中曾提及,在12代酷睿中核心性能的优先级吗?没错,按照这一设计,12代酷睿处理器的大核心在日常的大部分时间里,可能都不会动用到超线程功能。为此,英特尔干脆在12代酷睿里弄了个特殊设计,允许大核心在不启用超线程时,将原本为超线程功能设计的、多余μOP缓存队列直接用于主线程运算,相当于是将核心的部分规格“临时加倍”。还记得2006年英特尔曾在自家主板BIOS里泄露过的“逆超线程”技术吗?在12代酷睿的大核里,它说不定真的实现了。

与此同时,12代酷睿的小核心也并不简单。要知道,它的架构其实源自于英特尔多年前的“凌动”产品线,但经过多达8代的改进和重新设计后,无论是性能还是技术指标都已经不可同日而语了。

事实上,12代酷睿的小核心有一个特别明显的特征,就是它内部的执行端口数量多达17个!要知道,它的上一代架构(Tremont)执行端口只有8个,而12代酷睿的大核心也才只不过12个执行端口。但是12代酷睿小核心的17个执行又并非17个功能不同的组件,而是包含了大量重复功能的单元。

来自AnandTech


这就意味着12代酷睿的小核心,从一开始就是为运算量不大、但相对重复的计算任务所设计,比如说杀毒、视频编码( 游戏 直播)、AI面部识别等等。而这也正好对应了它理想状态下的工作职能,也就是主要用于执行那些辅助性质的程序,从而让大核心可以专注于重负载的主要线程。

当然,如果你非要用12代酷睿的小核心去“办大事”,它的性能也不是不够用。事实上,按照英特尔方面公布的信息显示,12代酷睿的小核心与6代酷睿(Skylake)相比,中等功耗条件下的单核性能提升了40%;同时,12代酷睿的小核心可以仅使用约60%的功耗,就达到6代酷睿的峰值单核性能水准。


这话说的有点绕,但在经过了外媒的换算后发现,12代酷睿小核心的峰值单核性能大约是6代酷睿单核性能的108%,同时其功耗仅比6代酷睿的60%略多一点。当然,英特尔或许是顾及脸面,没有直接拿10代桌面版酷睿进行对比,毕竟10代桌面版酷睿还在售,而它的架构其实同样也是6代的Skylake。

换而言之,也就是对于12代酷睿来说,哪怕是2大核+8小核的低端型号,其总体性能也有望超过10代酷睿的10核心顶配型号。而对于8大核+8小核的顶配12代酷睿来说,性能相比10核心的酷睿i9-10900K提升80%、甚至在部分场景里提升100%,都是有可能的。


总结:12代酷睿提升不小,但它还只是剧变的前奏


总的来说,虽然英特尔目前还没有对12代酷睿的性能进行大规模宣传,但从目前已知的资料中,我们已经感受到了它此次架构改变的巨大以及性能提升的明显。


这是不是一件好事?无论对于PC行业、还是对于有志在今年年底或者明年春季换机的消费者来说,当然都是一件大好事。

反过来说,当处理器/显卡出现极大幅度的换代性能增长时,同时也意味着新的软件将会大幅提升对于硬件的需求(或者通过指令集适配,在新硬件上明显跑得更快),从而对还在使用老设备的用户造成一定的压力。


不过对于英特尔来说,12代酷睿的诞生,不仅仅意味着他们成功实现了新品竞争力的大幅提升,同时也意味着他们终于回到了产品快速更迭的轨道上来。至少,根据日前曝光的信息来看,英特尔早已规划好了从2022年到2026年的多代“大小核”处理器产品线,一边在研发全新的、可能带来30%甚至50%性能提升的下代和下下代大核架构。


另一方面,性能高功耗还低的“小核心”设计,未来也有望被进一步发扬光大。比如说可能会出现由多达64甚至128个小核心构成的服务器CPU,也可能会出现由8大核32小核组成的40核民用级新旗舰。

当然,更进一步地说,既然在12代酷睿里英特尔已经可以把“1大4小”做到5瓦的功耗水准,那么未来会不会有“2大8小”甚至“2大16小”设计的新制程处理器,再次进军智能手机等移动设备领域呢?


不得不说,12代酷睿打开了英特尔再次大幅进行技术创新的一扇大门。而这扇门里所蕴含的可能性,我们至今甚至还不能完全看透。


本文来自网络


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/13437248.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-06
下一篇 2023-08-06

发表评论

登录后才能评论

评论列表(0条)

保存