您现在的位置是:首页 > 头条新闻 >

IT自动化运营平台破解首创证券运维桎梏

2013-05-28 14:12:19作者:洪蕾来源:

摘要结合自身信息化现状,首创证券CIO伏劲松带领着其团队走出了一条自建IT自动化运营系统之路,成为行业内首吃螃蟹者,其另辟蹊径的做法为证券业IT运营树立了一个典型标杆,也让信息化工作更为有的放矢。...

  金融创新已成为金融企业的核心竞争力,而95%金融创新的实现,都极度依赖信息技术。

  中国证券业之所以用二十余年就赶上了发达国家两百多年的发展水平,信息技术手段功不可没。在证券业系统零中断的严苛风控要求下,证券业IT主管一直在探索一条切实可行的信息化实施路径,能将信息化工作中的人为误操作风险降至最低。

  如何减少IT运维人员的无效率工作,如何用最少的资源提供最多的服务, ITIL为证券行业的IT运营勾勒了一幅完美远景。作为热门概念之一,ITIL服务流程在很多行业内已趋于标准化水平,其先进性位居行业前列。但对发展历程不同,信息化程度相异的不同证券公司而言,ITIL未必是唯一的选择。

  于是,结合自身信息化现状,首创证券CIO伏劲松带领着其团队走出了一条自建IT自动化运营系统之路,成为行业内首吃螃蟹者,其另辟蹊径的做法为证券业IT运营树立了一个典型标杆,也让信息化工作更为有的放矢。

  ITIL实施遇阻 转投IT自动化

  ITIL,这个概念也是最初首创证券CIO伏劲松探索IT运营管理的切入点。

  2003年,伏劲松就带领公司IT团队开始学习、消化ITIL理念。“我们碰到的第一个棘手问题就是CMDB(Configuration Management Database,配置管理数据库)的构建。创建时需要收集哪些信息?哪些信息是我们必须的?如何满足配置项属性的‘精而不多’原则,为此我们部门开会讨论不下10次,耗费了很多心力。”谈及此,伏劲松一脸无奈。

  其实,企业在实施ITIL项目的时候,配置管理常常被视为项目的“鸡肋”——食之无味,弃之可惜。耗费大量人力和时间收集上来的各类IT基础架构信息最后却成为一个包袱——一个及其复杂而难以维护的“IT基础架构信息库”。

  被CMDB构建牵扯不少精力的同时,2004年,首创证券开始陆续上线监控系统——防火墙监控系统、流量分析监控系统、网管监控系统等。“我们一边搭建系统,一边尝试在ITIL这条路上继续摸索。”伏劲松坦言。

  将网管系统打造成一个集成监控系统,伏劲松也曾有过这个想法。“但这种做法在证券公司缺乏现实基础。首先,不同监控系统的供应商之间存在技术壁垒;其次,国际主流厂商的产品已经标准化,无法提供适合我们公司IT环境的产品;再次,国内的相关厂商也是鱼龙混杂。因此,集成网管系统这条路行不通。”

  如果说ITIL项目实施和集成网管系统这两条路遇阻碍,最终促成了首创证券IT运营管理系统建设的另辟蹊径,那么,IT自动化技术则为后来的平台搭建工作提供了一个坚实基础。

  “在真正了解IT自动化之后回过头看ITIL,我觉得ITIL存在两个问题:其一,ITIL看上去似乎很完美,但实施周期太长,流程繁琐,而我们面临的是要快速解决工作中所面临的实际问题;其二,ITIL回避的一个关键问题——人,它默认人能够正确执行ITIL所描述的规定流程,但实际工作中这需要很长的时间去磨合。证券公司经常进行应急演练规避各种风险,而一旦问题产生,在强压之下人的动作难免不会变形。要让所有流程都能稳定准确地执行,只能交给机器去做,也就是IT自动化。”伏劲松道:“IT自动化是ITIL的高级阶段,它已经做得比ITIL更好了,我觉得可以把ITIL丢掉。”

  三大系统构筑IT自动化运营平台

  认准了IT自动化这条路,首创证券开始系统规划实施。

  证券公司的IT环境有其特殊性,与交易所、银行以及分支机构的系统接口都有差异,证券公司自身几乎没有太多话语权。标准的不统一让整合工作变得十分必要也使之成为不少企业信息化建设过程中难以跨越的一个关键点。

  从首创系统当时的系统现状来看,防火墙监控系统、流量分析系统、网管系统等多个系统各成一脉,对应了多个“处理中心”。这样导致的后果是信息相互孤立,当问题发生时无法准确进行定位。

  “对证券公司而言,系统安全稳定是运维工作的首要重点,但运维人员长期处于高压力环境下工作,工作内容又琐碎繁多、重复性强,很容易形成疲沓工作状态,导致人为操作差错出现。我们目前的多个系统使我们管理的对象,监控系统就是一个感知应用系统健康状况的神经系统。但是如何高效地获得系统各种信息,我们就把这些监控系统集成到一个平台上,让平台成为我们系统的神经中枢。通过这个神经中枢,我们能够更准确地感触整个系统各个环节上的健康状况。”

  据伏劲松介绍,首创证券IT运营管理系统由三大组成部分组成,第一部分是监控系统,通过一个平台实现多种监控信息的收集、聚合、关联;第二部分是处理流程,我们建立规则库对问题的处理设定一个处理流程;第三部分就是根据流程操作执行,我们也把它们集成到了一个平台上。

  规则库的建立不可回避,这也就回到了当初ITIL实施中面临的问题——如何创建CMDB。

  伏劲松介绍说:“我们创建CMDB的方式比较有特色,通过把配置信息换成脚本,我们使CMDB能够面向整个系统,这样会很灵活。而且,这种做法也不会耗费我们很多时间,可以使我们把精力放在解决问题上。当我们发现某个问题而CMDB上没有相对应的配置信息时,我们只需要更新并重新发布一下脚本即可。”据伏劲松介绍,在对IT运营管理系统进行优化的过程中,他会考虑将IT自动化作为一种运营工具,形成对意外事件应对解决的一个学习机制。通过IT自动化来研究如何有效地分析采集信息,定位问题。

  2009年初,项目进入ITIL流程的完善阶段。在完成集中管理平台的建设之后,首创证券又进一步参考ITIL流程,设计适合自己的运营管理流程,将自动化的理念巧妙地融入ITIL流程当中。在探索与实现中,ITIL的执行力度比以往有了很大的改进,更有力地保证了IT运营管理工作流程的有效实施。

  系统维稳是第一要务

  如果计算机事故70%是由人为差错造成这种说法成立,那么引入IT自动化,对IT运营工作而言带来的最大好处是系统安全性得到了提升。 “举个例子,目前应对容量预警问题,我们可以迅速地定位问题原因,有效解决。”如伏劲松所言,基于IT自动化运营管理平台,IT运维工作更为轻松。

  “另一方面,IT自动化也是对人力资源的充分解放。目前公司的日常IT运营、运维工作总共只有三个人来承担,能够将另一部分员工的时间释放出来,聚焦在技术架构、合规管理、项目管理等更高层次的工作上,同时,也能够让我们有足够的人力来更深层次地优化既有IT自动化运营平台和整个IT架构。”伏劲松介绍道。

  证券IT运维工作需要操作人员强烈的责任心。即便个人的失误概率很低,但是因为系统的复杂性是呈几何级数方式增长,需要关注的地方太多,在向超出人所能及的方向快速发展,哪怕是一次失误,也有可能带来100%的出错几率。在证券公司,每个交易日开市前都需要进行系统检查,这一过程中一旦产生人为疏忽导致的系统故障,在高压力状况下,就很难迅速对故障产生原因进行定位和排除。而自动化解决方案可以确保几乎是百分之百的精确度,可以使重复操作的成本降低到很小。

  写在最后:

  证券是个“高压”行业,IT人员一次操作失误可能带来系统100%的出错几率,其后果严重性也与其他行业相比被放大无数倍。

  正因如此,首创证券技术总监伏劲松2003年就开始ITIL的研究,通过团队组织学习吸收ITIL概念,经历过理论与实践的碰撞,遭遇了CMDB架构的裹足不前,再到转投IT自动化怀抱。伏劲松对ITIL的落地实践自有体会,并基于首创公司系统现状,与第三方企业合作开发了一套证券公司IT自动化运营管理系统。

  实践证明,IT自动化运营管理系统不仅为首创证券节省了人力成本、减少差错率、延长设备使用周期,更有效地降低了IT运营成本。

  按首创证券(15家营业部)每年2000亿元的成交金额计,佣金比例按0.1%、交易时间按250个交易日、每天交易时间按4小时、客户索赔比例按10%计算,则年佣金收入为:2000亿元×0.1%=2亿元;一年的交易时间为:250交易日×4小时/日×60分钟/小时=60000分钟;所以,每分钟的佣金收入为:2亿元÷60000分钟=0.3万元;每分钟的客户索赔金额为:2000亿元÷60000分钟×10%=33.3万元。

  因此,系统每减少一分钟的宕机时间,为公司避免0.3万元+33.3万元=33.6万元的损失,平均每家营业部损失为33.6万元÷15家=2.24万元,对于一家拥有100家营业部的证券公司,减少一分钟宕机,可避免224万元的直接经济损失。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们