您现在的位置是:首页 > 数字化转型 >

推动灾难恢复外包服务的合力探讨

2009-11-06 22:48:00作者:侯海波来源:

摘要灾难恢复的话题已经讨论了很久,但是随着灾难恢复的技术出现,以及灾难恢复实现的手段创新和新的商业模式不断创新,怎么样实现灾难恢复是一个新的话题。比如说当前采用外包的方式实现灾难恢复已经成为全球的趋势,我们在这方面也一直进行持续关注,所以今天就灾难恢复外包方...

各位来宾大家下午好!我想就像刚才卢院长提的那样我们已经办了三、四届了,灾难恢复的话题已经讨论了很久,但是随着灾难恢复的技术出现,以及灾难恢复实现的手段创新和新的商业模式不断创新,怎么样实现灾难恢复是一个新的话题。比如说当前采用外包的方式实现灾难恢复已经成为全球的趋势,我们在这方面也一直进行持续关注,所以今天就灾难恢复外包方面跟大家做一个探讨和交流。

今天探讨的几个内容是推动中国灾难恢复外包方面的几个因素,我归纳成四个作用力,一个是企业成本驱动力,第二个是法规遵从推动力,第三个是外包服务公信力,最后我想跟大家分享一下我们在帮助一些厂商实现灾难恢复的外包服务的过程当中对技术的一些实践的体会。最后根据主持人要求增加两个案例,我亲身设计两个案例供大家分享。

我们还是从灾难恢复的实践方式来说起,尽管这个可能大家很多已经了解这个趋势。灾难恢复的实践模式企业可以有三种选择,一个是自建,一个是共建,一个是外包,自建首先需要做的事情非常多,你要选址,选一个跟你灾难恢复中心合理位置,你要做基建,机房的基础建设,你要做各种设施的部署,包括主机也好,存储也好,网络也好,最关键还要部署人力进行长期的运维。因此自建负担不是所有的企业都能够承受得起,我们国家到现在为止也就一些重要行业的一些大型的企业可能都已经建了自己的灾难恢复中心,比如说一些大型的银行,包括电信等等。但是绝对不是所有的企业都有实力做自建的,包括银行里面,现在一些商业银行和村镇银行基本上意向都是选择外包。

我们说外包是全球的一个趋势,下面资料稍微有点老,应该说现代趋势更加明显,越来越多企业选择了外包的方式来实现自己灾难恢复。这方面我们可以从一些合作厂商,从他们那里得到资料也可以看到这个趋势。外包核心价值是什么呢?确切的讲就是有第三方把一套公共的资源设施,包括机房,包括IT技术架构,包括这些人力资源,把它以共享的方式来分配给多个用户来进行使用,这样每个用户都可以用比较低成本实现自己容灾的需求,这是外包的一个最核心的价值,也是和我们现在讲集约化社会模式,趋势相符合的。

企业成本的驱动力。我想企业是一个追求利润最大化的单位,这么一个机构。那么在这里面我们可以给企业盘算一下,企业在实现自己的灾难恢复的时候,如果自建的话会做出多大付出,首先你需要有设备成本,你要部署你的后备主机,以备生产中心主机停机或者各种灾难不可用的时候后备主机要可以用,使你业务可以开展。后备存储,你需要把生产数据备上一份两份,甚至在线数据备完了,还需要磁带备份已备可恢复性。你需要不断持续把生产数据同步到生产灾备中心,这个成本其实是非常高的,因为是每天都在发生。

最后你还要有后备的访问量,当灾难发生的时候你需要用户从访问生产中心主机变成访问灾备中心主机,你需要一个后备容灾访问量,这是设备方面。

厂备方面需要建一个机房,我们国家情况下不是所有企业都能够拿到地方建后备中心,更不用说建基房这样基础设施,你需要做后备空调、消防、安保,电力,既然是灾备中心至少要两路电,这些都是一个比较重的负担。

除此硬的设备以外还需要投入更多,你需要对业务系统进行业务影响分析,找出那些业务风险,那些业务关键,你需要采用什么样策略来保护,达到什么样保护等级,这需要专业的背景知识才能做得更好。你之后需要做设计,作系统构建,构建之后根据构建的这套IT系统配套一个合理的灾难恢复的流程,以便灾难发生的时候能够合理的行动,规范的操作你IT设施,确保你的恢复是有效的。

到目前为止这些成本还仅仅是刚刚开始,你还需要漫长的一个运维,这里面需要人员住在灾备中心,你需要对系统不断进行运维测试,保证是可用的,你还要对数据进行恢复性测试,包括数据在需要的时候是可恢复的,可用的,完整性能够得到保证。你恢复的流程需要演练,你的应急资源需要不断的储备和更新,以应对真正灾难发生那一天,这些成本对一个普通中小企业来讲是比较昂贵的。

我想现在的企业应该更加关注是自己的核心价值,我们一个外包企业没有必要培养一定是信息技术的企业,如果有了这样外包手段,这个企业可以把自己的业务集中到自己的核心价值,能够发挥核心价值方面,并且能够保证业务持续的运行。

第二,法规遵从推动力。过去讲信息系统是自己企业的事情,停就停了,但是越来越多国际上趋势,好象有16000多部法规已经对企业自己的信息系统提出了越来越多要求。你的信息系统已经不是你企业自己的事情,他的停机会给社会带来更多影响,数据丢失会带来不良影响。比如说银行系统把用户的信息给丢失,在这种情况下就越来越多的法规开始格外的关心你企业的IT信息,在这方面我们国家也有很多这种政策和法规,我这里面列出一些法规。实际上从2005年颁布了《信息系统灾难恢复稚嫩》以后,各个行业尤其是金融业、证券业、保险业都对自己行业企业信息系统在终端方面提出了要求。去年8月份发布的企业内部控制规范,这是总个名字,这下面还有很多细的规范,比如说财务方面要求,这其中有一个规范是针对信息系统的,其中就明确提出,大企业一定要做自己灾备,而且是异地的,每年还要做定期的演练。当然这个法规还是针对大型企业的,大型企业怎么定义,我看上面没有定义很清楚,至少包括国资委管的企业,以及公众公司,这里面可能欠缺的是小企业怎么办,其实很多小企业所做的事情以及信息系统和数据丢失对社会影响也是很大的,可能这方面还需要政府做进一步工作。

第三,我凭什么把数据交给第三方,在这个问题下我们企业应该关注那些方面,做外包服务的企业关注什么。我也经常和用户接触,用户很多顾虑,用户本来数据自己备份,为了容灾我送到银行保险箱,我采用第三方机构之后,我可能要通过我的链不断把数据传送到第三方灾备中心,这个数据传输过程当中是相当于多开了一个窗口,对我的数据是多增加了一份不安全。这还不是最主要的,最主要是我把数据交给你之后,这个数据能不能保管的非常好,很多企业说我安防做的比较好,我信息系统安全漏洞也比较少,我做的非常好,但是用户关心的时候往往说我其实担心你们内部人,我的数据交给你之后,你能不能保证我的数据不会被你的员工以各种目的拷贝出去。这个可能就比较关键的,这个可能除了技术手段,管理手段,还需要第三方公信力来解决。

比如说我的服务到期了,你为我服务了一年,为我保存了很多数据,我现在不买你的服务了,你的数据能不能帮我彻底销毁,会不会在你硬盘里面保存,某一天被某些人再利用,这些都是企业要有顾虑的,这个顾虑作为企业也不过分,确实是不能为了安全反而增加了不安全因素。

还有一些问题,我即使这些问题都解决了,我把数据交给你,我需要恢复的时候你能恢复吗,这个数据还可用吗?我需要恢复到前一天你是不是只能恢复到前一个星期的。我需要两个小时恢复,有这么一个约定,你是不是最后一天,因为你的技术工人熟练程度一天才能恢复出来。最可怕的是根本就恢复不了,这个时候我跟你怎么样说这个事情,因为这样的事情很可能发生,即使企业自己建自己灾备中心都有可能数据没有办法恢复,更不用说第三方了。这时候怎么办?很多外包服务商说我通过这些资质,比如说ISO2000,27000,BS25999的认证,这几个认证都是针对企业自身的,并没有说你要对外提供服务,你能满足什么样要求。这方面国际上新加坡走的比较早,他有IS507,他对服务商资质能力提出了一些要求。这个标准也正在成为国际标准,但是至少到目前为止国际上包括国内还没有一个可以参考的标准,来鉴定我们的外包服务商,说你的服务达到一定的级别,可以给公众一个公信力,使得公众可以放心到你这容灾,所以这方面工作也成为我们现在外包服务的障碍,还需要我们去克服。

最后我来谈谈技术,这些技术不成系统,确确实实为用户构建公众容灾系统的时候都遇到过,外包确实不像一个企业一样,生产中心是我的,灾备中心也是我的,这个外包复制技术,如果有点问题我都还能自己处理,如果上升到一个外包所采用复制技术必须要考虑很多因素。比如说这个技术支持不支持你的架构,我既然是公共平台中心,我可能一套系统为20个系统,100个系统提供服务,不断把用户数据复制过来,用户终端又是多种多样的,这种情况下你的架构能不能满足很多用户运营,这首先对技术提出了要求。

另外要求我采用这种技术一定要有一个能够产生清晰的服务界面,这是什么意思呢?我刚才讲到如果用户自己灾备中心,自己生产中心数据复制是没有问题的,那边出问题都是我自己的事情,你成为第三方采用这种技术,如果一旦发生数据传输不完整,怎么样界定是用户自身的问题还是外包服务商的问题,这可能要求你复制技术在某个地方给用户一个清晰界面。

另外用户数据是可验证的,如果恢复的时候用户说这不是我交给你的数据,这就比较麻烦。我们给厂商设计的时候也有很多方案,比如说用户加密,包括用户上传之前对文件进行一个换算,就是用户签名,最后核对签名,证明你给我的数据就是坏的,我恢复不会去也不是第三方责任。

技术影响对技术架构改动非常少,你不能让用户适应你改变很多地方,这对用户来讲都是很恐怖的事情。还有一项技术,大家都听说过,在灾难恢复当中也是非常有重要的地位,就是重复数据删除,这最主要价值实际上就在于我数据伸删除之后,我传输数量少了,这样有带宽满足我的数据同步要求,这个价值对于我们来说还是非常大的,因为很多用户带宽并不富裕。这里面也有问题,重复数据必须是数据有重复才能压缩,要不然本来是重复数据,为了安全期间要加密,可能重复数据就很难查到,这样可能会增加带宽,这也是业界需要解决的问题,今天有这么多厂商,我把这个问题也提出来。

最后我还想讲一下,我们不能把技术抛给用户,我应该包装成服务用户需要的服务。这里面想对服务有几个要求,第一你是全程服务,从用户早期的分析,告诉用户面临什么样风险,那些业务系统关键,关键到什么程度,应该是一个什么样的策略,一直到帮助用户去实施、维护,帮助用户制定预案和演练,都应该是能够提供的。当灾难发生的时候用户配合我做什么,我怎么配合你,只有这些做到了,才能帮助把用户灾难恢复落到实处,而不仅仅是把传过来就行。

第二多层次的服务,你对很多用户提供服务,用户的需求是千差万别的,有的可能是备份数据就够了,我一周就可以,我灾难发生的时候恢复到前一周的数据就可以,有的恢复到一天可以,有的只允许数据丢失两个小时,还有可能在几分钟的范围,你的技术架构也应该是灵活的或者是多种多样的,从备份到复制,到持续数据保护,这些新的技术都会用到。

最后我们跟用户提供一个自助式服务,用户能不能通过网站定制我的服务,我需要什么样服务我可以通过网站进行开通,而不是复杂的方案和实施的过程。这个服务应该是透明的,我每天向你传了多少数据,我保护那些系统,现在数据量保存了多少,这个保存的周期有多长,我应该都是透明的,你应该把信息向帐单一样推送给我,或者我随时可以进行查询,这样才能构成一个真正的外包服务。

最后我介绍两个案例,这个是某城市电子政务系统的公共容灾的模型,实际上已经在建,初期是十个用户,这个方案最主要一个特征,它采用了一个硬件客户端的方式,在每个用户端装了一个客户端,通过这个跟用户形成非常清楚的界面,我们跟用户这么约定,你想保存的重要数据,你只要放在黑盒子里面,剩下的保护任务就是我的,我会通过互联网定期的或者实时把黑盒子保护关键数据同步到我的容灾中心,任何时候只要你数据需要恢复的时候,我能够按照你当初放到黑盒子里面数据,能够把数据提交给你。有了这么一个黑盒子以后,这种服务方式一个是比较简单的,另外也增加了恢复的方式,用户首先考虑从本地恢复,如果用户本地还在灾难不太大从本地恢复,如果灾难比较大,灾备中心可以把用户数据复制到类似黑盒子里面,快速的运送到用户现场,然后在用户本地进行恢复。当然也可以进行网络恢复,前提是灾难不太大,至少网络还是通畅的。

这是某个企业推出基于软件及服务的模式推出的外包服务,也是为用户提供重要数据保存,当然也包括系统。这个特点就是用户端需要安装一个客户端,通过客户端根据我中心设定的策略,定时的把用户需要保存的这些数据抓取回来,并且通过互联网送到中心,用户需要恢复的时候可以通过自己的服务界面找到自己保存的数据,需要版本进行恢复,这个方式比较简单,但是效率可能受一些影响,这只适合于一些小型企业或者是一些个人甚至个人办公的企业。

左面这两个页面是已经开发完成的服务页面,通过服务页面用户可以看到自己服务状况,每天备了多少数据,那些数据备份成功了,那些没有成功,在外包厂商占用多大空间。

最后是我故弄玄虚的,把这几个力画了一个图,说外包市场启动需要很多方面共同作用,除了企业自己不可抗拒的,有自己成本驱动力之外,法规的推动也是一个主要的作用。另外是需要外包服务厂商通过我技术的革新或者设计也好,和我自己提供的服务公信力来共同拉动,这样用户灾备需求就会转变为我们外部厂商外包服务的强大市场。这就是我今天交流的内容,谢谢。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们