您现在的位置是:首页 > 数字化转型 >
灾备五部曲
2009-11-06 22:53:00作者:栾波来源:
摘要我先给大家介绍一下容灾中心现在面临的挑战还有趋势。大家都知道容灾数据中心面临的挑战最重要的一点是需要提高灾难的恢复能力,这是到目前为止容灾中心管理人员最重要的目标。其次是提高资源利用率和降低功耗。而如何提高灾备中心的容灾水平呢?这里不仅要提高的是IT设备的...
大家好,我自我介绍一下,我是浪潮集团容灾产品经理栾波。对于浪潮集团我感觉大家已经比较熟悉了,所以我今天直接切入正题。我向大家介绍一下灾备五步曲。
我先给大家介绍一下容灾中心现在面临的挑战还有趋势。大家都知道容灾数据中心面临的挑战最重要的一点是需要提高灾难的恢复能力,这是到目前为止容灾中心管理人员最重要的目标。其次是提高资源利用率和降低功耗。而如何提高灾备中心的容灾水平呢?这里不仅要提高的是IT设备的可靠性,还要注意整个基础建设,比如说我容灾中心是建在地震高发区,那么我就要注意基础设施的抗震水平。如果灾备中心是建在流域地区,我要考虑整个地区抗洪水平。整个容灾中心的建设不止是要考虑到IT设备,因为我们今天的会是关于IT的,所以我就会着重的在IT设备方面对大家做一下介绍。
随着容灾中心的扩大,不管是各种资源还是功耗都是在不断的增加,现在社会国家提倡的要建立绿色的能源,集约型社会,我们要通过这种技术和重复数据删除等技术来降低功耗,提高存储资源的利用,充分利用整体的存储空间。而未来容灾中心发展趋势,第一肯定是要包括整个IT设备的整合,就像刚才侯顾问和冯经理说的会有三种方式,第一种是外包,第二种是自建,第三种是合作。
不管是哪一种方式,整个容灾中心的规模都会不断的扩大,而当容灾中心扩大到一定规模之后,它的整个系统利用率就会提高,提高之后就可能会降低整个容灾中心的准入门槛,而吸引众多本来没有能力自建容灾中心的中小企业加入进来。整个容灾中心的规模肯定是不断扩大的。
随着容灾中心规模的扩大,整个的人员水平还有整个资源的利用率都会得到提高,所以说有可能会导致成本的进一步下降,而产生一种规模效应。
存储在容灾中心地位,存储不管是IT设备,在我们业务当中既算做数据,存储的是数据,网络中传输的还是数据,所有的业务正在经历以网络为核心,转向以数据为核心,数据的安全和存储被提到前所未有的位置,存储系统成为数据存储的基础载体,它在容灾中心的地位是必不可少的。
下面给大家也少一下构建高可用容灾中心的五个步骤,第一,我们首先要探讨一下为什么要建设高可用的数据中心。而这块前两位嘉宾都已经谈过了,我就不在多说了。构建高可用数据中心无非就是为了抵御天灾,比如说洪灾火灾等不可抗逆,另外可以抵御黑客或者工作人员的误操作等人为的一些因素。而9.11和汶川大地震也提醒我们灾难吞噬一切,建立容灾中心是必不可少的。而我们认为存储数据中心容灾建设是分为五步的,第一,是要确定方案,就是容灾中心要建在哪里,建成什么样规模,满足什么样的需求,这是第一方面的。
第二方面是要建设容灾中心的基础设施,包括水、电、楼房的抗震,还有通风、电力等,一切方面都要考虑到。
第三方面是容灾中心创建之后,也是需要分批来创建的,不可能一下子把所有的业务都搬入到容灾中心当中,这样就要对所有业务进行分级,重要性高的业务首先安置在容灾中心内,次核心业务可以随后等后续设施建造好之后迁入容灾中心,核心业务方案可以采用BCP方案,用次核心业务可以采用数据径向方案,最后剩下外围系统方案可以使用CPD和远程复制。
下面我给大家详细介绍一下这五个步骤,第一个步骤肯定是要评估用户的数据风险。这是我们浪潮集团的一个模型,如何评定客户的业务风险。当然这个例子只是一个范例,我们还要根据用户的实际应用水平与他处在位置,与他业务的类型来确定。
容灾是高可用数据中心根本,我们如何确定容灾的方案呢?容灾系统最重要达到的目的是什么呢?第一,肯定要是要是主系统数据实时传输到远程备份系。第二,主机点的应用程序可以切换到容灾站点继续运行。在正常情况下我们需要把本地生产数据远程复制到容灾数据中心,而当本地数据受到损坏,比如说受到病毒侵害的情况下我们可以立即在容灾中心的数据复制回本地,来恢复生产。而当产生火灾等毁灭性灾难的时候,可能整个数据中心都已经不复存在了,这时候容灾数据中信海安全可以完全在本地重建生产系统,然后依据容灾中心的数据来恢复生产。当然这是容灾的基本理念,而我们在当下的情况下,业务都是很重要的,不可能根据这种方案来进行,这只是介绍一下容灾的基本原理。
而我们如何确定想要使用的容灾方式呢?需要考虑到两点:第一个是2PO,一个是RTO,你的业务容忍的数据到底是多少要知道。我们列了三种实现层次,第一种是基于存储的,通过存储系统内制功能将数据复制到远端,当然这个是最低级的容灾方式,2PO小于5分钟,RTO小于一个小时,就这一个小时来说有很多核心业务,比如说财务等方面,银行业务是不允许有这么长的时间,我们又有基于主机,通过主机上的软件功能将数据复制到远端。它的优点是当本地的应用宕机之后可以通过远端机群切入到远端进行生产。第三种最高级是通过网络容灾,通过IP网络将数据复制多远端,无缝接入到生产系统。
我们建设整个容灾中心国家早已有规范的,2007年国家标准信息系统灾难恢复规范正式发布,这是中国灾难备份与恢复行业第一个国家标准,于2007年11月1日开始正式实施,在这个法规当中确定了业务连续是最高级别的容灾,对容灾恢复能力做了六个等级的划分。大家可以看到第六级数据零丢失和远程机群支持,这是我们一直追求的容灾最高境界。而我们确定好业务所需要的容灾级别之后,我在下面讲到几个步骤就是针对不同级别容灾。我给大家介绍一下步骤二建设容灾数据中心,第一肯定要建设容灾数据中心的基础设施,计算机机房必须要符合国家的有关规定,抗震需求或者说抗火的需求。工程辅助设施和生活复式,符合容灾恢复要求。
对人员的管理,刚才两位也都介绍过了,对人的要求其实是容灾中心最重要的一点,必须要在灾难发生的时候严格按照制定好的流程,实行迅速有素操作,迅速恢复生产。而维护管理能力就要考验到整个数据中心管理人员的能力。
IT设备的选择与方案的确定,这一切都做好之后,我们就可以把我们的业务搬入到容灾中心当中这是我给大家介绍一个案例,是对核心业务采用基于持续业务保护的容灾。可以看到本地的应用服务通过远程集群受到了灾备中心服务器的保护,并且通过远程数据同步在本地跟备份中心实现实时的数据同步。这个案例的优点是具有本地存储高可用全部优势,而且还有径向模式可以选择,RPO约定于零,切换时间只有几分钟。而我们主核心业务搬入到容灾中心之后可以对次核心业务采用基于存储的容灾方式,这种实践方式是把数据通过严惩复制到灾备中心,实现数据级的备份,大家注意到这不是应用级的备份。
等到核心业务与次核心业务都成功的安置到容灾中心之后,对于剩余的外围系统,我们可以采用机遇备份的数据异地容灾,大家看到此案例是利用VTL虚拟磁带库远程功能,备份到远端,当本地发生灾难的时候,可以通过把数据复制回来,从而实现容灾。
最后给大家介绍一下浪潮针对数据中心容灾的产品。我这次着重介绍的是我们新开发的海量存储软件BCP保护模块,我给大家介绍一下BCP功能。基于本地共享磁盘,可以根据预先策略切换到容灾中心服务器上,而浪潮BCP可以保护径向两台服务器业务在其中一台发生故障时切换到另外一台服务器上,支持同步复制和异步复制两种模式。
浪潮BCP可以支持远程容灾,通过远程径向将基于共享存储的两端应用保护起来,可以是现在一段服务器出现故障时,现有本地高可用接管,本地不能接管,可以由远程接管。
最后图给大家介绍采用浪潮BCP容灾方案,大家看到主机端可以利用BCP软件实现故障切换,存储端可以利用BCP软件实现数据同步,满足了数据零丢失和远程机群支持的最高的容灾标准。谢谢大家。
(本文不涉密)
责任编辑:
上一篇:灾难恢复:从理论到实践
下一篇:建立多层次服务的共用容灾中心