您现在的位置是:首页 > 数字化转型 >

赵红波:“监管控”运维一体化解决方案

2009-11-20 03:26:00作者: 来源:

摘要我是来自于惠普的软件事业部,我叫赵江波,今天演讲的题目是“促进政府信息化管理工作更好更快更科学发展”,听起来这个名字比较与时俱进,我想说明的一点是我们国家以前重建设,重发展,但是在和谐方面做得不够,所以,现在推进和谐社会,提出科学发展观,其实我们IT发展的...

我是来自于惠普的软件事业部,我叫赵江波,今天演讲的题目是“促进政府信息化管理工作更好更快更科学发展”,听起来这个名字比较与时俱进,我想说明的一点是我们国家以前重建设,重发展,但是在和谐方面做得不够,所以,现在推进和谐社会,提出科学发展观,其实我们IT发展的历史到现在也正在面临这么一个过程,以前叫做重建设,轻运维,重硬件,轻软件,惠普软件部发展的历史也是一步步朝着这个轨道发展,所以,我们希望能够帮助各位把信息化的管理工作更好更快更科学的管理起来。

在正式开始之前做一个小的引子,五个不同颜色的房子住着五个不同国籍的人,每个人和一个牌子的饮料,抽不同牌子的烟,养不同的宠物。现在请您回答谁在养鱼?一般智商比较高的需要花两分钟的时间。我们换一个说法,五个不同的业务部门使得五个不同的业务系统,跑在不同的操作系统硬件平台上,连着不同的数据库,连着不同的存储,现在出现一个问题。还以银行为例子,转帐。如果有了这么一张图,咱们看一下,德国人住在绿色的房子里抽着王子牌的烟,养一条小金鱼。谁在养这条小金鱼?德国人。大概两秒答案就出来了。惠普软件的理念其实就在这张图上。我们的理念有两个方面。第一,我要把信息化看得清清楚楚,看两方面内容。第一,我有什么,注意,不在这个表上,是在这个表上。第二,他们是怎么关联的。我们的运维系统一定能为我们快速的解决问题。所以,我现在给您用两秒的时间您就解决这个问题。

我今天的内容有两个方面。以前大家对我们的软件比较熟,现在我们把整个软件的产品线叫做BTO。运维我们分三个方面,监视、管理和控制。在没有中间这三道之前,这就是以前的IT信息技术,上面有各种各样的业务部门,底下我们通过一些服务器,硬件软件,还有一些服务搭建一些面条式的应用系统。这套系统只为一个业务部门服务。业务发展到一定程度之后,你发现面条是不行的,一定要采用一些虚拟化的技术。我的IT发展速度很快以后,我会面临三个方面的挑战,我们惠普的软件主要解决这三个方面的问题。

第一个层次其实就是采用虚拟化的技术,把你的硬件平台实化,所以,我们管它叫做适应性的基础嫁给,有了这个以后,我如何去定位我的战略,如何定位我的业绩,如何做运维,因为系统这么多,人这么多,流程这么多,我到底怎么管理,这是惠普最近几年大力发展的一个方向。再往上叫做业务信息化。还拿中国移动举例子,明年它推出一个短信套餐,它凭什么说这个短信套餐是0.25元而不是0.5元,它一定是很长时间的信息积累以后进行了数据挖掘,做出了有效的决策,才会得出0.25。信息是你的价值,我们还有一套产品线业务信息化。以前大家都知道惠普是一个硬件公司,但是2005年以后我们经过十几次收购,其实就是丰富了中间的三条产品线。

惠普软件是做什么的?我想给大家做一个定位,惠普的软件是做IT管理的。在座的各位领导以后想到任何有关IT管理的请来找惠普。我们惠普把IT的管理分成三个主要方面的挑战,战略应用和运维。所谓战略我新在座各位天天想的一个问题,我的业务部门很多的业务需求,同时我手里还有很多人财物,还有我的时间,我如何有效的匹配。你的战略如何做?我们有一个很好的解决方案,项目与组合管理,项目怎么通过有效的资源组合进行管理,这里面我们有很多智能分析的支持。当战略定了以后,你会进入到一个应用的阶段。我们不是做开发的管理,主要做应用上线的质量保证。总指挥按一下绿色按纽的时候,他心里压力很大,他一定得拿到一个完整的测试报告,功能是不是都OK了,性能是不是都够用了,是否安全了,别上线了被黑客轰瘫了,这是各位应用层面关心的问题。很多应用开发我们已经不做了,所以,开发方面我们没有花太大力气。

当应用做好以后,就进入到一个运维的阶段。运维我们分为三个主要方面的挑战,监视、管理和控制。监视就是最左边的,您需要一双眼睛,把网络、主机和应用看清楚。中间就好象我们的手,你怎么批量自动化处理呢?我们管这条产品线叫控制,你需要控制客户端的PC。再往右边是管理,这就是您的大脑,您需要管人和管物。所以,我们有一个资产管理,还有一个IT服务管理。惠普这些年一共经过了十几次的收购,在这个领域发生了很多。应用领域我们花了45亿美元买了美克丽,控我们花15亿美元买的(奥克斯)。所以,以后惠普不只是一个卖打印机的公司。这是第三方的一些评估报告,在这方面惠普的表现都不错。换句话说,它如果不是世界第一的话,我们是不会买它的。

我今天的主要内容是运行维护,怎么做运行维护?这张图各位一定是天天放在脑子里的,第一,我制订制订最左边的运维制度,制度制订了以后,我运行维护的流程是什么,遇到什么问题,谁解决,解决到什么时候才OK,有了流程我们搭配我们的队伍,我们设置了我们的岗位,最后我们设置一个运维技术的平台。惠普可以给你提供什么呢?第一,咨询服务。辅助的我们有很多工具和产品。这是国家运行维护的标准和规范,这是国家要求的,但是每一个部门不一定水平达到一致。这是我们日常维护的一些内容,机房,安全的存储。你的运行支撑平台一般需要监控平台、服务平台、运行维护流程、运行维护队伍。惠普的解决方案是什么?很清楚,上面所有相关的人,下面是我们管理的一些对象。在这三个中间,天天互动的就是三个方面的内容。运维三个方面,监视、管理和控制,我们叫监管控。

刚才也说了,我们可以做一些咨询服务,这是我们很重要的工具,我们管它加运维管理成熟度模型的一个演进,我们把监视、管理、控制这三个主要的挑战按照不同的成熟度模型从阶段一到阶段五,我们怎么跟您做呢?第一,跟您做一个现状的定位,比方在监视方面,咱们一些基础设施的监控,比如网管已经上了,但是业务您还没有监控起来,用户使用你的业务体验是什么,你不知道。在管理方面,我相信很多都已经上OA的系统,很多运维的流程你是通过OA来做的,但是你没有一个集中的运维平台,控制方面有一些自动化的脚本。我们会根据您的情况设定一个目标。咱们一步步来做。

监视说白了就是给您一双漂亮的大眼睛,把整个地球都看在眼里。这张图特别说明问题,以前大家都说我监控就监控基础设施就行了,所有的基础设施我的运营维护水平都特别高,全是百分之九十九点几,但是我的业务只有82%,所以,你现在花再大的精力能把99.4%升成99.9吗?再花几百万几千万不一定,所以,解决问题要从下面入手。第二,问题的回溯和定位特别困难。最右边最大的问题红色你能很快的定位那是NT的问题吗?剩下七条道你怎么知道是NT的问题?所以,一定要从业务角度入手。

这个是一个实际的案例,为了找到谁养了这条小金鱼,这个用户花了一天和几千万美元,最后他找到问题。你应该怎么做呢?你看最右边这张图,全世界都在这儿,上面有好多绿色的灯,代表在这个点上的业务它的用户使用是正常的,如果是黄色的代表变慢,如果是红色的代表不能用,你看的是业务,不是那个点上的服务器。下面是一个业务的图,比如你核心以银行作为例子,中间是核心银行系统,左下角是个人电子银行,再往左边比方咱们叫转帐,这个图就很清楚了,哪个业务的用户体验是什么,有什么问题。

惠普提供一个特别全面的监控方案,左上角是服务水平,我们的服务水平是怎么得来的?用那张图简单计算就OK了,右上角最重要的紧急的事情,可以很轻松的看出今天最慢的业务和最慢的地区,左下角德国人养的小金鱼,右下角你点到左边一个节点,所有发生的错误事件全部在右边。通过这四个方面就实现了我们刚开始花了两秒就把这个问题解决了。这就是我们的监视。

我们的大脑是什么呢?这就是我们的运营维护流程。大家天天做工作,有一套成熟的工具确保什么事情按照正确的流程来吗?不一定。或者按照这样来你能量化吗?不一定。所以,需要一套工具把你的思想固化执行下去。IT服务管理基本上三个好处,对你的价值是什么呢?第一,世界上先进管理经验,大家都是这么做的,这么做最好。第二绩效考核,我们以前有个客户,所有的工单进来以后大家有一张大表,每个人上面摘牌,到月底一看谁水平高,谁水平低一目了然,这个就很清楚了。最后,服务业绩。所有这些一定要通过一个IT服务管理来做。这是我们咨询的一些方法论,通过这五个阶段来做。

惠普在运维管理领域表现不错。大脑说完了,看我们这双手,我以一个案例作为引子。在2600台服务器做软件变更升级的时候,原来需要两周,现在只需要20秒。600台服务器的安装与配置原来要四个月,现在两周就完了。800台服务器的合规审计原来32周,现在两天。服务器安全检测的自动化做到服务级别,原来一个礼拜80个故障,现在只有一个故障。所以,效率的提升特别大。这就是做自动化控制的一个意义。

自动化我们都可以做什么呢?中间四块是我们的对象,我们可以把网络服务器存储和客户端全部自动化起来,我们还有整个的一条流程自动化。做这些动作的时候是需要一个流程工程系把它串起来,比方你做一个系统1.0到2.0升级的时候,你需要一个流程管理器把它一连串的做起来。

以这张图总结一下自动化控制,左边是我们做的一个实际的案例,从的1.0到2.0的完整升级,包括十几次的系统重启,还有数据库的配置,应用系统到最后的健康检查等全部都在这里,全部都是自动化的,没有人去做。

好处是什么呢?第一,效率的提升,这是毋庸置疑的。第二,这是一个专家的知识库,我以一个部委作为例子,假设你有30个省,每个省部署这么一条系统的时候有30个专家去吗?没有。有这个软件你一个专家就变成了30个,这是一个很强大的知识库。第三,机器做永远不会出错,但是人做真未必。少重启一次,敲错字母啊,太平常了。我举个例子,大家使用信用卡,你很少接到工行给你发短信说我在大概四五个小时之内要进行系统的升级,请你在这个期间不要用。但是招行有时候就会收到,原因是因为工行用了我们这套软件,招行没有用。当所有服务器配置的变更都通过这种方式来做的时候,你的机器永远处在一个引致的状态。而不是谁敢动那台服务器,动了就趴。那里面发生什么事情没人知道。所以,给您提供一个机器人,我应该把孙悟空放在这儿,拔一根毛就可以变成好多小的孙悟空。

我的题目是要一体化,你的运维一定是先看到问题的故障,然后走流程去确认,最后进行诊断和修复。最优边的德国人养的小金鱼的图就串出来了。标准的处理流程,比方常见问题数据库扩容一点帮你做了。但是不是随随便便扩,要先在运维系统开工单,开完找领导审批,领导同意了,调用我们孙悟空的自动化,把它全部变更了。变更完了更新配置管理数据库。所以,这就叫做一体化。惠普最强大的一点,你比方你现在在市场上很多国内,甚至开源的都有监控的工具,但它未必有控制工具。其实你的日常工作这三方面是不可割裂的,所以,你一定要是一体化的。

最后分享一个案例。我建一个很大的数据中心,门店一定要做好。这是中石化的新的大楼,你会看到很漂亮,网络是什么,总部是什么。进去又分这么多小屏,左上角全国的网络,第二块是总部,右边最重要的紧急的事情,天天在上面列着,领导天天盯着看。第四块一看是绿色的,就代表那台服务器是好的,右下角跟这些卫星,中间是机房。

所以,回到刚才您的需求,比方您要监控机房,监控数据库,监控网络,都在这个屏幕上可以看到。回到我们成熟度模型,经过刚才的监管控,相当于给你武装到牙齿了,您可以选择这样的一个方式方法来提升你的运维。所以,我觉得现在用户最关注的你不是做应用系统的建设,现在一般来讲,咱们开飞机的做运维的,惠普是你最好的一个合作伙伴,这也是我们这些年花这么多钱的主要原因,希望这些投资能为您的业务增砖添瓦。感谢大家提供这次机会,让我跟大家做一个演讲。谢谢大家。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们