您现在的位置是:首页 > 数字化转型 >
H3C数据中心解决方案部副部长李德刚:H3C网络道路选择
摘要2011年9月28日,以“新技术与应用推动产业变革”为主题的“2011中国计算机技术大会”在北京香格里拉饭店隆重举行。...
2011年9月28日,以“新技术与应用推动产业变革”为主题的“2011中国计算机技术大会”在北京香格里拉饭店隆重举行。
以下为云计算分论坛中,H3C数据中心解决方案部副部长李德刚发表的主题为《H3C网络道路选择》的演讲。
李德刚:谢谢会议主办方,谢谢大家。我们是一个网络厂商,我们在云的建设方面和我们现在国内的用聊起来,大家都觉得讲这个云是不是跟尚层的软件平台和业务系统更相关一点。对往网络他说他的影响要么就是没有什么影响,或者是基本上就是和网络是无关的,但是我们要看到,真正的云计算的数据中心,他最大的和传统数据中心的区别就是多了一个虚拟化的层次。多了虚拟化层,对数据中心整个构架讲产生了很多的不足。因此,今天我这个主题就是道路选择的问题。为什么要做道路选择,就是因为现在很多的新的技术,新的标准,那么都是在云计算的大前提下产生的。
作为用户讲,如何避免一些技术风险的投资的一些回避,这个就需选择一个正确的建设方式。我们来看一下,在国内整个市场讲,数据中心这个市场才是刚刚展现了这么一个市场,就是说对于单纯数据中心的建设还没有完全成熟,现在国内已经很快的过渡到了云计算。云计算这个数据中心建设,直接进入云计算数据中心建设我们从网络的层面,从一个全新的角度看一下主要有四个方面的对传统的数据中心的建设,网络的一个挑战。
第一个挑战就是整个的服务器的互联,从原来的物理服务器直接互联,现在过渡到虚拟服务器之间的互联这个对于传统网络是一个挑战。第二个就是整个的网络系统我们讲IO的整合和简化,如果做到数据中心的IO转化,就是把网络改编成一个严格服务质量的网络。
数据包发出去基本上就不管他是否可以正常的达到,也不会做数据校对的工作。还有一些存储的数据在上面。第三个就是从小规模的二次网络到超大规模的网络,有很多性能的要求。性能的要求就是需要大型的集群,他要求我们大量的服务器在一个大的二次网络里面,不能有三层的网络连接,这样导致了小的二层网络扩到到大网络范围。一般这个事物都是经过量变到质变的变化。最后是从鼓励的管理到智能联动的管理,那么对构建云计算的平台来讲,现在最核心的技术或者是大家争论最大的热点,就是自动化。
那么只有真正做到自动化,才是真正意义上的云计算的平台或者是符合云计算的精神。今天我们从这四个方面来介绍一下我们在这四个方面有哪些挑战,应对挑战的方式是什么样。
第一个就是计算虚拟化对网络的影响。首先传统服务器对网络来讲,他是一个地址,不管是IP地址也好,从规格的角度讲,包括一些流量的负载,都是相对比较小的。大家为了提升这个硬件的使用效率,让一个服务器处于一个中将状态,这样就是让单个服务器剧增。现在方案从虚拟化的角度讲,大格局已经形成了。但是他们有一个最大的特征就是很多虚拟机之间的网络交换,他是使用服务器仿真的交换机我们很多网络的流量用传统网络的管理方式,他没有办法看到数据流量从服务器流到外面。因为很多流量从服务器内部产生,我们外部根本无法感知,这个就模糊了边界。这样带来的问题就是流量无法监管。
那么网络如何来改变或者是提升整个虚拟机网络的性能,那么现在这个道路就是一个是软交换的道路,一个是硬交换的道路,软交换就是依托与这个服务器的软件平台,我们的虚拟机通过仿真做交换。另外硬交换就是采用类似于外部的交换机上面去。这样在外部的网络交换机进行一个流量的迁移,不管是虚拟机还是对虚拟机之间,所有的流量都经过传统的网络设备,这样我们一些比如说对流量的监控,策略的设施都可以按照传统的方式部署。他可以减轻服务器自身负责的压力,让服务器只做计算相关的事情,把网络所有的任务,下移到交换机上面做。
那么不管是从性能讲,还是从管理的角度讲,都可以简化用户的使用。那么我们整个解决之道讲,是采用了一个标准开放体系,微化是QBG的标准,预计在明年的年初会正式发布。那么作为产品和方案讲,我们会紧跟整个的标准来做一个开放的互联,和所有的虚拟机进行一个对接。这是第一个问题就是虚拟机网络。现在大量的方案都是集中到了网络和服务器之间。不能说是最后一公里,大家可能听的比较多,只能说最好一英尺的距离。
第二个就是传递的网络到严格服务质量的网络。我们看,第二个是从小规模的二层网络到大规模的二层网络,我们看一下什么是二层网络,大家觉得传统的二层网络不会跨IP地址所有的服务器在一个网端内部。 我们看许多的虚拟机运营商讲他的功能特性的时候,第一个就是虚拟机的迁移,那么他们只是讲到HA怎么实现,不会讲这个网络是怎么构建的,这个背后是需要大的二层网络,如果要实现不同服务器之间的虚拟机实力的迁移,所有的迁移和被迁移者必须在一个网关地址下面。这样才可以实现迁移。
因此,如果我是一个服务器集群的规模就是从原来很小的数量发展到大规模的数量,需要实现一些跨不同机架的迁移的时候,我们这个二层网络就是从很小的范围,就是一个交换机下面很小的范围就是扩展到大的业务区块的范围。如果扩大到这个范围,就会出现问题,大家知道,网络最怕的是什么呢?网络最怕的问题就是出现这个环路。出现环路的话,大家知道有很多传统协议可以做避免,他就是相当于我是一个全联通的荣誉连接,但是我通过协议把一边的物理通道让他处于一个阻塞的状态,就是保证网络内部不会出现环路。如果一旦发生这个链路要切换,这个传统的生成数的效率是很低的,这样就会导致我整个数据中心,他这个HA维持一个较低的水平,因此采用传统的大型的技术去构建,就是把生成数的东西照搬起来,是远远不够的。
我们是采用一个IF的解决方案,就是把这个网络进行一个虚拟化。那么我们可以看到,他把这个两台的网络设备,甚至是四台虚拟化整合成一台网络设备,这样对整个数据中心的逻辑连接讲是一个单心性的连接。但是从逻辑的角度讲他是一个点对点的连接方式,这样就可以不用部署类似于这种协议。所有的链路他可以捆绑在一起同时工作,就是他这个带宽提升了一倍。
那么现在我们最大的集群规模,或者是多少台服务器构成大的网络我们在淘宝做了测试,使用两台12518的设备,构建了5000台的网络,就是从服务器的千兆带宽一直到交换机,中间没有任何的收敛,我们通过四台的虚拟机方案,已经做到10000台服务器在二层的服务。大层的网络范围再扩大,未来谁知道会不会成果一万台服务器的规模,这时候我们有一标准协议。这个是IETF提出的协议。他就是在二层网络上他的控制协议采用的是三层路由的方式,他有一点颠覆传统,在这个二层网络上跑路由,这个实现了在二层上的多层互联。他这个支持的数量是可以上到10万规模以上,在一个大的二层网络里面同时利用了整个的链路。
数据中心网络内部的构建,尤其是二层网络的构建,在大规模的网络情况下未来扩展到更大规模的情况下,我们可以过渡到使用标准。基本上这个也是我们在构建这个数据中心整个的网络架构的时候,一个基本的策略,从IF到四台的虚拟化。目前在业界是处于一个绝对领先的位置,目前只有华三的一家可以做,其他的网络厂商都做不到。
第三个就是传输网络到一个严格服务质量保证的网络。大家看到,数据中心内部一般来讲,都会有两套网络产生,第一个是H3C的网络设备,从这个单机架讲这个影响不是很大,但是这个数据中心尤其是面向云的服务,这个规模上来以后,那么一是从工程的复杂度讲,提升了复杂度,第三个就是从数据中心的散热来讲,意味着我们的散热要要率越来越低,尤其是一些大规模的面向云计算的建设,就指用电效率的标杆。那么因,如果说数据中心可以做到1.1,或者是1.4是比较先进的数据中心了,像大型的互联网公司,他没有智能设备,就是靠自然风夺这个事,只有这一类的数据中心才可以趋近于1,就是对整个布线的要求,对服务的走线的要求讲,我们需要整合。
这时候需要新型的融合性增强有太网,他相当是把有太网有丢包的状态进行一个改变他保证了以太网可以承载不同的业务,他是通过了一系列的协议来组成的。第一个是PFC的协议,第二个是EGS,这些协议是配合工作来实现物流包的数据的传输。首先PFC是把万兆的通道逻辑上划分了多个通道,每一个通道对不同的业务,同时他自己具有一个独立的缓存和流量控制的机制。EGS是做流量的调动,这个是怎么定义怎么分类的。在一个数据通道没有数据流的时候,其他的数据是不是可以占这个通道,他是由这个协议定义的。第三个就是像早期的网络,不同的设备进行对接的时候,先要做协商。我这边是100兆的端口,你那边是1000兆的端口,我们会协商一个认同的速率。因此就是要求你以100兆的速率发送。我这一边的数据通道怎么定义的,你那边也要做相应的定义,因此大家看到,现在很多的网络厂商在宣称自己的方案,或者是设备是面向数据中心或者是云计算的,其实是看支持不支持这个有太网是一个要求。组成一个面向数据中心的网络。
那么目前应用来讲,最典型的协议就是FCOE的协议,那么从整个网络发展过程讲,我们是看到了有三个步骤,第一个是全分离的状态,就是我们现在建设的状态,所有的服务器是两套线路连接上来的,以及服务器进行一个互联,半融合准备是在把服务器的IO进行一个整合,再通过他分别连接到存储网络和服务器的网络里面去。在全融合的结构看,就是只看到有太网这个接口。那在这里大家有没有想过,为什么整合数据中心的I0会使用有太网的协议,其实最主要的原因是有太网这个协议的端口成本足够低,现在一个千兆网络也不算什么,而万兆这个服务器端口来说基本是普及的状态。
第二个原因就是以太网这个接口的带宽速率已经远远超过其他的网络连接协议,比如说光纤通道,FC协议,比如说现在看到最高的带宽是8个G。但是以太网这个标准协议去年就已经发布了40G和100个的规范,因此从这个角度讲,性能又高这么好的技术或者是选择,大家会不约而同的选择他,整合IO的选择。
那么对于我们来说,整个解决方案或者是整个发展来说,这三个步骤是不可能一下过渡到融合的状态,他毕竟会经历一个半融合的过渡期,这个过程是非常漫长的。那么最后是一个从管理的角度看,数据中心对这个网络协议的进一步的要求,那么首先我们看到,自动化的定义,他对整个数据中心的管理造成一定的改变,传统的数据中心来讲,一个服务器,按照独立的操作系统,再去安装独立的应用,每一个都是一个很垂直的纵向处置体系,有了虚拟化成立以后,所有的服务器的硬件,划分到一个资源池里面。所有的软件业务基本上都是架构在这个虚拟层面之上的,这个时候我们就需要有一个统一的管理平台。
这个管理平台完成什么样的任务呢?原来数据中心内部服务器是管服务器的,存储是管存储的,网络是管网络各自是独立的平台,现在就是需要有一个平台可以调用硬件的管理资源,同时我要达到什么样的目的,或者是达到什么样的效果,就是根据我新上的业务就是从这个云计算的数据中心划分出一个资源池以后把它作为一个服务,可以调用相应的资源。就是可以为这个服务有一个自动的生成,不同的服务面向不同业务资源池,要实现这一点没有一个强大的策划管理平台是做不到的。
如果没有策划,交给机器做,我新上一个业务他需要怎么分配,怎么存储,交给IT人员完成,这个人员就是天天的跑来跑去,单纯做一些配置性的工作已经是很大的工作量了,不用说业务变更和迁移的工作了。对于自动化讲,就是使这部分工作由整个的业务系统自己完成,同时管理的力度形成一个虚拟化的管理。
那么原来的这种方式,针对服务器,针对存储,针对网络他是一个很粗略的管理。可以针对一个CPU,针对不同的内存空间,针对不同的存储空间来进行管理,这个是虚拟的管理。那么我们是怎么样做这个实心的呢?这里是一个简化的部署图。在我们的服务器来进行虚拟机的生成的时候,我们可以通过管理平台,就是这个IMC的平台,首先服务器部署了虚拟机以后,他把所有的虚拟机的部署状态汇报给IMC的平台脏我们的网络和服务器进行对接的时候,会从这个IMC资源调度和管理平台上调取,这样他可以做到零配置,直接和服务器对接,就知道服务器上面有什么样的虚拟机和网络资源。这时候就会形成一个全自动化的部署方式,这个平台可以说是现在整个云计算,大的基础资源平台里面最关键的一点。
因为我们看到,国内很多的基础资源的管理平台,都是基于虚拟化平台去做的,也就是说对于服务器的资源和存储的资源调度可以通过一个平台调度的非常好。但是对于网络讲是一个空白,不管是国内也好,还是国外也好,这个是基本上现在来说整个是一个空白。没有那一个解决方案的供应商可以做到我今天生成一个新的业务组,我相应的网络可以自动化的配合这个业务组,还没有哪一个解决方案可以做到这一步。因此我们只是我们实现的千里之行始于足下。
从整个回顾一下,我们这个数据中心的全局看,首先网络之间的连接,是有一个大层的连接。从原来的小规模的二层互联扩展到整个数据中心的二层互联。未来我们在讲一些云数据中心的互联,第二个就是和虚拟机进行网络,这个网络必须感知到这个网络的层次。他原来是物理连接,未来网络他是一个虚拟连接,连接的是虚拟机。第三个就融合,整个服务器的融合,进行一个互联。第四个就是自动化的管理,那么整个拉同了数据中心内部和网络,其他资源配合的问题。
那么从产品的角度讲我们是已经有了全系列的数据中心的产品,从这个软件,到硬件,那么基本上可以说目前在全球讲,除了这个思科,就是我们用友最全的产品系列,那么最后云计算讲是在国内很多企业做的比较靠前的。比如说淘宝,搜狐等等。在国内讲真正的云计算平台,比如说无锡,苏州的这些云计算中心,也是华商配合我们的用户来进行搭建的。未来整个的云计算是非常广阔的时代,而华商作为解决业务方案的提供商,会帮助我们的用户进行一个更好的解决方案的提供和搭建。我这一边的汇报就到这里。
(本文不涉密)
责任编辑: