传统网络在技术和产品方面比较成熟。数据中心网络在建设过程中,主要以传统网络为标准,通过对其修补来匹配数据中心网络的要求。
斗转星移,传统网络的劣势随着数据中心的发展在逐渐放大。AI、边缘计算等新的业务形态对数据中心的网络提出了新的新需求,南北向流量的增长、对时延和吞吐要求的不断提高,使对数据中心网络技术的研究逐渐成为一个比较紧迫的事情。各种国际标准组织纷纷成立相关的研究组来开展相关工作。网络已经不再只是一个流量转发的只需要追求稳定的平台,它逐渐成为一个重要的生产环节,成为数据中心创新的一个重要方面。
2、什么新场景?数据中心技术与承载业务的发展变化,是数据中心对网络产生新需求的重要原因。
一方面,随着计算虚拟化、存储虚拟化的快速发展,计算、存储资源进一步整合,极大地提高了计算、存储执行效率与资源利用率,而网络具有数据传输的重要功能,必须进行相应的调整,以迎合其它方面技术发展带来的新需求。
另一方面,数据中心相关业务发展对网络的性能提出更高的要求。相关业务场景包括大型在线数据密集(OLDI)服务,如用于在线购物,社交媒体和网络搜索的自动推荐系统;高性能深度学习网络;NVMe高速存储业务等应用场景。OLDI需要对高频率、高速率的请求进行即时回应;深度学习在模型训练过程中需要高性能的计算系统,并行计算数据的传输通信时间极大影响着计算的性能;NVMe非常适合未来云数据中心高度并行的要求,而为保证NVMe的可靠性,需要对网络在延时方面提出更加苛刻的要求。
这些业务场景的不断涌现和进一步深度应用,也使得数据中心对于内部网络的要求不断提高。
3、现在有什么问题?目前数据中心在网络方面存在诸多需要解决的问题。
以数据中心当前主流的Scale-out架构为例,其主要是2级、3级CLOS,少数可能达到5级、6级CLOS。而many-to-one流量模型和all-to-all流量模型,使得这种架构在未来数据中心新场景下存在丢包、时延、吞吐等多方面的挑战。
图1 many-to-one流量模型 图2 all-to-all流量模型
如图1所示为many-to-one流量模型,流量从server1到server5、从server7到server5、从server9到server5,整网无阻塞, 只有leaf2向server5的方向出端口方向buffer是瓶颈。如图2所示为all-to-all流量模型,流量从server1到server5、从server9到server6,整网无阻塞, 只有spine1向leaf2的方向出端口方向buffer是瓶颈。上述网络中的瓶颈问题,将会极大的影响数据中心网络的性能,需要采用适当的方法解决瓶颈产生的影响。
4、无损网络如何做?针对数据中心网络面对的各种问题,相关机构进行了深入的研究,提出了相应的解决方案。无损网络是数据中心网络问题的解决方案之一,其主要通过拥塞控制、负载均衡、流量控制等方式,解决包括many-to-one和all-to-all流量模型在内的数据中心网络存在的问题,其技术发展也主要是在这三个方面发展。
其中流量控制主要是管理两个节点之间的数据传输速率,通过接收端的反馈,从而调节发送端发送数据的速率,使得接收端接收与发送端发送相匹配。
负载均衡是接收端和发送端存在多条路径的情况下,将两节点间的流量合理的在多条了路径上进行分发。
网络拥塞会引起数据包在网络设备中排队甚至导致队列溢出而丢弃,是导致网络高动态时延的主要原因,拥塞控制很好的解决了上述问题。
目前,无损网络技术主要在以上三个方面进行技术创新,解决数据中心网络面临的问题。
5、我们能做什么?无损网络是开放数据中心标准推进委员会(ODCC)的重点研究内容之一,已经得到了中国信息通信研究院、中国电信、中国移动、百度、美团、华为、Mellanox等企事业单位的支持,相关的技术规范和白皮书也在制定当中,将于今年十月的开放数据中心峰会发布相关的成果。数据中心网络已经不能很好的适应技术、业务场景对于数据中心网络的要求,随着技术和业务场景的发展,这种影响将逐步扩大。为了更好的服务数据中心业务新需求,需要通过新技术、新产品解决数据中心面临的网络问题,这样不仅有利于数据中心的长远发展,同时也有利于企业技术创新,产品换代。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)