您现在的位置是:首页 > 数字化转型 >
英特尔马红雨:Intel DCM助力数据中心能耗管理
摘要2015年4月15日,由中国计算机报主办,中国计算机行业协会、中国计算机用户协会、中国信息化推进联盟数据中心专业委员会协办的“2015年第八届中国数据中心大会”在京召开。以下内容是英特尔中国高级业务拓展经理马红雨发表的题目为《Intel DCM助力数据中心能耗管理》的主题演讲。...
马红雨:各位嘉宾各位朋友大家下午好,我是来自英特尔中国这边负责数据中心软件业务的马红雨。之前包括泛达包括其他的厂商,包括从各个方面给大家介绍了我们在数据中心行业如何做到更好的节能减排。我今天分享是我们英特尔公司我们专门做芯片的,我们从服务器这边如何做到IT产品的节能减排,配合我们整个的一个数据中心的发展。
我们也知道,就是说我们整个的这样一个世界目前是一个互联网的时代,我们可以看到根据有关部门的统计,我们在智能设备方面,在云方面,或者在高性能计算或者是大数据行业都是蓬勃发展的时代,现在是互联网的时代。以全球用户来讲,每个人都有三台设备连接到互联网,时时刻刻下载数据,计算应用。这个就造成我们后台整个的数据中心这个行业蓬勃发展。
那么对数据中心产业来讲,三个基本的要素。第一就是使用我们的电。我们一定要充电。第二是我们的网络,我们一定要联网,我们有了网络才能达到我们的结点。第三个是空间。在这三个基本要素里面,我们可以知道这个电是每天每时每客都在消耗的。这个为什么我们把这个电作为能耗的热度。尤其是数据中心的行业,在2006年2007年2008年发展的时候,大家对运维的管理,对整个的运维的成本的投入来讲,会越来越关注。在这一块来讲我们的能耗是非常热的话题。
这个是数据中心整个的行业的挑战。我们知道我们现在效率来讲效率相对来讲比较低,我们目前来讲平均在数据中心行业我们的IT利用率,那么英特尔的EPU在不断的改进,那么这样每一代的改进,我们从今年来讲,我们叫 这样的比重。在这样的情况下,我们的频率不断的在提高,但是我们的利用率还是非常低的。目前来讲,传统的这种数据中心它的PUE还在2.0或者是2.0以上的标准和现状。另外我们平均运维的水平相对来讲还是不足的。
目前来讲 这个行业里面,我们有非常多的国际的厂商,国内的厂商,我们都在这方面做更多这样的管理使我们的整个业务运维的水平能够提高。同时,我们现在的能耗还是比较高的,我们在一个非IT的设备,如果PUE是50%,并没有用在我们整个核心IT的应用的基础上。所以在这方面来讲,影响PUE主要的因素是我们的IT设备。我们的利用率低,如果空调调整的话,你的PUE就高。如果相同的负载,你的室外的温度越高,那么你PUE会化肥更多的空中制冷,来进行这样的冷却。就是这个PUE和我们的IT和通风制冷都有非常大的关系。很正常的例子,IT设备占到50%,可能我的通风制冷设备可能会占35%到40%,那么其他的PPU到门禁这样的系统。
所以我们看到我们去做到管理的话,最大的方向一个是我们的通风的制冷系统,一个是我们的IT设备。那么针对IT设备的能耗管理,我们有我们这么一套我们数据中心管理平台的系统。那么它目前来讲我们是从2006年在我们既有的平台上做的。到现在来讲我们已经有将近九年的时间了,目前来讲都在我们的本土在开发。我们企业有两个产品,一个是能耗管理的增加,针对我们IT设备的能耗进行管理和分析。另外有一个KPM的软件的远端,通过大概的方式去读取到远端的系统,不断你是什么阶段,这都是我们通过软件去做。另外我们也和合作伙伴一起,我们国内也有很多的合作伙伴,这里来讲可以直接和他们一起实施数据中心的咨询和服务。
那么,就是说我们目前来讲,所有的开发人员都在上海。我们是一个全球性的一个产品,但是来讲我们在中国有一个核心的独特的优势,我们在服务和支持来讲,都是本土化的支持和本土化的服务。这是我们在全球做的一些成功的案例。这边主要是我们英特尔自有品牌比较大的影响力比较大的情况。包括我们的合作伙伴,还有我们数据中心的合作伙伴,包括我们OEM的合作伙伴,他们也有很多的案例。包括我们在中国的一个很大的一个数据中心做的这样的一些整个的这样一个实施的案例,这些案例它的白皮书都可以在我们的平台上去下载查阅。
我们DCM的话,提供了我们OEM的窗口,我们更多想和我们的合作伙伴做第三方面集成。我们提供中间件的开发包。如果要做数据中心能耗管理的话,第一个首先要把这些人统计出来,也就是我们时时的检测是做管理的第一步,也是我们基础的基础。第二步,就是我们现在像大数据一样,我们有一些数据,通过一年、半年的数据,我们如何去分析它?所以首先来讲,我们可以做到这样的管理,我们不管你下面是什么样的服务器的设备,什么IT设备,我们都可以通过大概的位置实施进风口的温度。拿到这个之后我们可以做这个,做一个天花板的能耗把它降下来,或者我们做开关的能耗。如果在我们不影响性能和业务的情况下同时进行。这是我们我们DCM为我们数据中心带来的价值,这个是我们的一些比较 普遍的这样的价值,它在我们的网站上可以查到。
目前来讲我们可以看到我们是数据中心层次的管理方案。我们可以从检测某一台设备,把这个设备结合到一个组管理。一个物理组可以是一个机箱,我们整个都可以做这样的一个,从整个一条线得到整个的功耗。然后来讲,在这方面来讲,就是这样的异构化的一个,你从三大国际厂商,或者是国内的四大厂商,不管是哪一家的服务器产品,我们想和他们合作,可以拿到整个的能耗的系统,这个来讲都不需要装任何的OS,跟我们的OS没有任何的关系。拿到之后我们可以做一些自动化的设备,从而达到我降耗的过程。同时,发生紧急情况,比如说我的空调断电和失灵,对业务中等的可以把它降到风化状态同时可以保证高优先级业务的运行。
另外来讲我还可以发现将士服务器。在我的服务器里面总有一些服务器不容易察觉,但是他们一直在消耗,但是他们一直没有负载,或者负载的非常低5%以内或者是10%以内的服务器,我们要把这些服务器找出来,我们可以给它直接关机,这是我们整个的开关的操作。
同时,如果我们知道我们服务器的负载类型,那么在我们的组级别,白天是峰值,晚上是谷值,那么我们就可以在每天早上六点批量的开机,晚上的十点可以把批量的服务器关闭。这个来讲是我们就是说发现热点,我们知道DCM可以通过不需要任何硬件成本,同时达到我们服务器的进风口的温度。达到进风口的温度,如果我们机房里面有两千个服务器,就是两千个时时的温度计,这个相当于说我对两千个温度计进行分析,那么我就知道你的当前的优化的温度是多少。我就会整个知道你的当前的过渡机房,它属于什么问题?因为冷热通道混合或者是什么情况?如果过渡制冷我们可以建议调整空调的条风口的温度,提升一度可以减少能源5%。这个通过IT的分析调整通风制冷的系统,达到我们的能耗,这是我们可以做到的。
另外一个是我们可以增加我们的机械的密度。我们到目前还有很多老的数据中心,我们没有机会做更新和建设,那么在这种时候我们的业务来的时候我会调试新的设备,那么这个时候我的设备放在哪个机柜里面?但是毕竟我们的DCM的功耗,我们在一家中国的一个大数据中心,它当时的机柜的容量是20A,那么在20A的基础上,他是不敢放服务器的,但是我们发现它的峰值,每一个机柜14台的峰值,在2000瓦,跟我20A的400瓦。这个有一个安全运营,在这种情况下我们一步一步的提升。我们就帮它提升了71%的机柜的密度。这是我们做一些运用。
这是关于我们利用能耗管理和我们温度的管理可以更好的做到容量的管理和能耗的优化。这是我们的,我们传统的数据中心我们采用的DCM硬件,这样的话我们可以做到这样的一个情况,这个硬件的成本是非常贵的。因为软件来讲我们可以做到一个控制台,我们可以管理多个服务器,如果说我们两千个服务器我们会有两千个列表,我们同带宽的方式打通它。那么在各个阶段都可以直接去控制、管理它。
目前来讲,我们也有OEM的方法,这个有 ,它每一台服务器都需要两个访问,没有密码也是非常的麻烦的事情。我们的平台做到管理到异地的服务器。目前来讲我们有KVM的交换机,我们通过我们的网络我们可以接到这个数据中心的零台服务器上。我们做到统一的大概的管理,这是我们纯粹的一个软件接触方案。我们去远程安装操作系统,可以做到这方面的事情。另外来讲,我们只需要用一个业务的一线,就是非常方便,非常便捷,而且看起来是非常的优美的方案。
主要来讲我们对成本来讲,我们不需要昂贵的交换机。这是我们目前来讲对 一个是能源管理,一个是远程接入。能源管理包括交换机还有存储设备,都可以拿到整个的能耗,对它进行分析,分析之后对它进行优化和控制。当然优化和控制都是通过我们实际的现场的不同的需求来进行的。这样也有实施和这样的服务。主要透过这样的能源检测我们能够做一些什么能源场景。
这是我们目前来讲我们产品方案为我们数据中心行业所带来的这些价值,谢谢大家。
主持人:马总对英特尔的介绍,我们对英特尔不只是一个厂商,我们对能源管理已经做了很多年的研究。
马红雨:在4月8号我们做了IBF,里面有很多包括联通智能,服务器智能、PAD等行业都有发现,大家可以通过我们的行业客户建议,达到我们这个行业的发展。当然,芯片的能耗管理我们同样也是客户发展的一个非常重要的话题,我们一定会不断的去关注它。
(本文不涉密)
责任编辑: