原文:《金融业的数字化转型,ServiceHot 怎能缺席》

随着金融行业数字化转型和金融科技创新应用的不断加快,依托传统IT架构建设的核心金融业务系统与基于云计算、大数据、区块链技术构建的数字化创新业务之间,无论在底层架构、技术应用,还是管理方式上都存在着巨大的差异和数据断层,数字化业务规模越大管理难度越高。

而身处其中的ServiceHot,客户却覆盖了国有大型银行、股份制商业银行、大型保险集团、一线券商。


ServiceHot专家把运维分为“基础设施建设”和“IT运行维护”两大领域,并进一步提炼出包括“业务管理”、“人员与组织”、“流程与制度”、“技术与工具”的四大管理模型。本文结合金融行业的特性,将逐一解读:

一、业务管理:从运维走向运营

随着金融业务的迅速发展和规模的急剧扩大,金融IT系统的数量、规模及复杂度呈几何级增长。业务对IT系统的安全性、可用性与持续性依赖程度越来越高。因此,“科技支撑业务”是金融行业科技部门的指导方针,稳定运行和控制风险则是IT系统运维的第一要素。但随之带来的问题是:IT运维部门不断陷入到建设基础设施、处理系统故障、应对突发业务压力、频繁变更上线、预防网络入侵和信息泄露等安全风险的具体工作中,年复一年日复一日,压力非常大。但因为缺乏“IT服务成本指标”、“面向业务的服务水平管理”等标准,运维工作的好坏在业务价值上的体现不明显。

另一方面,在客户互联网化、移动化发展趋势下,以及利率市场化的挑战下,银行从战略和战术层面积极应对,提出了金融互联网、大数据、电子商务、客户体验等战略目标,并需要为此快速推出创新业务。但这些目标所需要的海量IT能力和实时响应速度,往往不是传统IT基础设施解决方案所能满足的。IT部门和业务部门的关系,已经从“科技支撑业务”变成了需要“科技引领业务”。

在此情况下,IT运维部门面临的挑战进一步加大,系统可用性要求越来越高,允许的维护、变更等计划时间越来越少,为了业务创新和营销活动还必须快速投产新项目、扩容基础设施。

未来的运维工作要应对这样的挑战,首先要明确定义运维部门自身的业务是什么,从“被动响应需求和故障”向“主动提供更优质的服务”演进。为此要先做好顶层设计与规划。根据具体的业务目标,制订出运维部门自身的业务目标,清晰梳理出运维需要对外提供的服务,实现IT服务管理,并根据业务目标不断迭代,实现从“被动运维”向“主动运营”的跨越式发展。图1是根据互联网和金融的运维经验,总结出的运维和运营的主要业务场景,供大家参考。

 

二、人员和组织:从天下名将"走向体系保障

运维上层的业务目标和管理思想的变化,必然会带来人员和组织的变革。传统运维在组织上往往采取按照职能划分为“烟囱式”的部门,部门之间的壁垒与鸿沟很大,跨部门的沟通与协调成本过高。在人员方面,金融行业普遍聘用外部公司人员,水平参差不齐,自主运维能力不足,且应急响应速度与工作饱和度、岗位专业化与综合化之间均存在矛盾。正如乱世出英雄,在此情况下,每个部门都会出现一些能力非常突出的技术骨干,运维工作在很大程度上依靠他们个体的能力和经验,可谓运维的“天下名将”。

“天下名将”的运维模式,对于个人而言是非常好的锻炼,短期之内效果不错,但很难复制和形成标准化的培训体系。对于组织而言则是一个巨大的风险和不确定因素,毕竟人都可能会犯错,同时还存在人员更换和流失的风险。

未来,随着金融业在新核心中加速引入“分布式架构”、“SOA的开发框架”等新技术,会对传统的运维组织模式带来挑战。两地三中心、分布式数据中心、devops等新的管理模式也要求组织架构做出相应变化。云计算、大数据、虚拟化、软件定义数据中心等新技术也会对传统运维人员的能力提出挑战。为了迎接这些变化和挑战,需要运维管理部门打破传统的组织壁垒,形成一体化的运维模式,以及良好的绩效考核和人员培训长效机制,通过体系实现运维保障。当前,一些银行实行的“一体化大运行”和“二次分配”都是比较好的尝试。

 

三、流程与制度:从“txt”模式走向“exe”模式

传统金融行业非常重视风险与合规,在流程与制度上下大功夫。从ITIL流程体系建设开始,到COBIT和六西格玛理论,制订出了大量的流程和制度,为业务的稳定运行起到很好的效果。但从IT运维的运行效果看,由于过分强调流程管控,流程做得非常重,导致流程的自动化和智能化程度不高,制度执行的自动化监督和检查手段不足。由于流程制度落地的“最后一公里”还是依靠人来进行,很多情况下流于纸面的“txt”。迫切需要引入运维数据分析工具和自动化、智能化的流程工具平台,确保流程和工具的不断改进和自动执行,形成“exe”模式。另外,由于整个技术架构和运维思想的变化,还需要运维管理的职能部门与时俱进,重组服务流程、修订组织制度。

 

四、技术与工具:从分散走向整合

金融行业从信息化的开始,就非常重视技术与工具的应用。如图2所示的工具应用过程,第一阶段是监控体系的建立,第二阶段是IT服务管理体系的建立,第三阶段是自动化运维工具的建立,无论是重视度还是投入度在国内各行业都处于领先地位。

回顾金融业运维工具的引入历程和使用效果,也存在一些不足,强调工具本身的先进性和技术选型,忽视了工具背后的管理思想以及配套流程和制度的修订,导致整体技术架构的灵活性不足,各种异构的管理工具产品缺乏有效整合,总体自动化程度不高。例如,监控系统的广度和深度不够;ITIL系统侧重于流程建立和工单审批,核心的配置管理和变更管理未得到很好应用;运维自动化工具侧重于简单重复的操作自动化,覆盖的场景少。

随着虚拟化和云计算的普及,以及传统的大型机和小型机向开放平台迁移,未来数据中心管理的基础设施规模和复杂度都将急剧增加,实现海量基础设施的管理和业务的敏捷,将是运维部门必须面对的课题。在这种情况下,通过运维工具实现自动化和精细化管理,是唯一的办法。运维部门必须抛弃原来孤立和分散采购运维工具的思路,在统一的规划下,以建设运维管理体系为目标,整合和改进运维工具,并将人员组织、流程制度融合与固化到运维工具中,实现技术标准化、资源弹性化、管理自动化、管控集中化、运行可视化、流程智能化。

 

五、对于金融IT运维的总结和展望

未来IT发展的方向一定是“去IT化”,即通过科技创新,实现IT和业务的融合,完美快速地交付IT服务,使IT部门从成本中心、服务提供者的角色,转变为企业内各部门业务发展的战略伙伴,实现科技引领业务。对金融行业更是如此,随着互联网宅银行的全面开放,未来的企业竞争一定是业务和技术融合的综合能力竞争。

因此,新一代金融数据中心的建设和运维,重点不是关注技术概念,也不是单纯思考如何利用技术重建或翻新数据中心,而是根据自身业务发展现状和未来规划,逐步实现在技术工具、人员组织、流程制度、业务管理四个核心要素方面的有机融合和持续改进。因此,未来的运维模式将对数据中心运营服务的管理能力产生巨大影响,也对传统IT运营团队提出了更高要求,需具备更新、更全面、更高层次的技术、运营、管理和服务等综合能力。

当前,金融行业出于安全性考虑,更多会选择私有云作为云计算的实施方向和切入点。对于金融行业的IT管理部门而言,云计算可以有效解决传统数据中心面临的资源管理复杂、运维操作风险高、服务响应慢等难题,节约了大量成本,增加了业务敏捷性。随着深入应用云计算技术,未来银行业可能形成内部私有云和外部行业公有云相结合的混合云模式,实现“实时基础设施”。

 

ServiceHot 专家认为“三分基础设施建设,七分运维体系建设”,对于金融行业来说,关键是能与时俱进地变革自身,构建高效的管理体系。运维变革最终完成的标志是面向业务的动态变更。最终的成败和效果不仅取决于技术因素和数据中心建设因素,而是由整个企业的IT战略决定。需要从战略、规划、架构、开发、运维多个领域进行统筹规划,提升部门间的沟通和协作水平,促进应用架构与基础设施架构融合,设计出更合理的应用架构,提升应用研发速度和用户体验,让业务人员和最终用户感知到效果。 对所有金融行业的IT运维从业者而言,未来是“危”与“机”共存的时代。既要支撑当前的业务平稳运行,又要大力推进面向未来的转型,每一个行业从业者,必然会面临很大的压力和危机意识。另一方面,这也给大家创造了弯道超车、打造先进云数据中心的跨越式发展机遇。推动运维行业变革,从传统的“运维”走向“运营”,从“成本部门”变成“效益部门”,是所有运维从业者的希望。相信在不久的将来,通过行业同仁的共同努力,“让天下没有难运维的数据中心”这一美好愿望定能实现。