原文:《剖析IT运维管理当前面临的问题》

随着中国信息化水平发展的加速,IT系统越来越复杂,越来越庞大,公司业务对IT系统的依赖性也日渐提高,IT系统的任何波动和故障,都会直接影响公司业务的正常开展和进行,企业需要具备合理有效的IT运维策略来保证业务系统的正常运作。


一、IT运维管理的现状及问题


信息系统的架构创新不仅仅带来了效率提升、成本下降等管理层面的价值,更是成为了企业加速形成差异化经营、保持核心竞争力优势的关键,而IT系统的运维与管理是企业业务系统的保障,更是企业生存和快速发展的支撑。


公司在信息化水平日益完善的同时,随之而来的是更多的应用系统、软硬件平台和设备等需要维护和管理。如何对结构复杂的IT系统进行有效的监控和管理,已经成为了企业信息化部门非常关注的一个问题。作为IT管理部门,经常被大量的IT故障和问题所困扰,“拆东墙补西墙”的尴尬场景也是常常上演。不论哪一家企业,只要它的员工和IT系统发展到一定的水平,就会不可避免地面临IT系统管理的一系列难题。


IT运维管理工作中可能存在的问题有:


1.1.IT运维管理机制不完善,流程操作不统一


许多企业尚没有建立起稳定和规范的IT运维机制。现有的IT运维流程的操作不规范不统一。如IT事件单提交之后,事件预判和优先级的设定不统一,没有规范性的指导文档,仅以运维工程师的经验判断或约定俗成的主观方式引导IT事件的处理。有识别但不规范,有处理但无管理,有人员但疲于应付,有系统但用不好。因此,“轻规范、重维护”的IT运维管理现状很容易造成因员工技能水平参差不齐带来的IT运维不稳定,直接影响维护体系的效果。简单点说就是还未脱离传统管理思想的束缚。


1.2.过度依赖核心人员,年轻员工成长慢


IT运维管理是一个系统性的技能,在实际工作中积累的的经验始终仅能在小范围内得到传播和继承,这就形成了企业里面的一个特殊景象,同样是IT运维部门,有的员工独挡一面从白天忙到天黑累倒吐血,有的员工经验平平帮不上什么忙反倒悠哉游哉。尤其是IT的使用部门,对于有经验的IT运维人员更加依赖和倚重,这样导致了无论是IT事件性质的识别、优先级的界定,还是问题的分析判断,均汇总至少数核心人员进行处理。所谓大事小事一把抓,这样不仅增加了少数核心人员的工作量,也容易产生工作流程的“瓶颈”,降低运维管理部门整体的工作效率,也会让一些核心员工产生巨大的压力感。


1.3.IT运维管理的KPI考核机制尚不完善

现在有很多企业的IT运维部门的绩效考核难执行,绩效考核的标准也很难制定,匆匆上马的绩效考核也难见效。目前在绩效考核方面虽然采用填写表单的方式对不同岗位的工作时间进行收集、评测和考核,虽然确实体现了IT运维人员的工作量和工作负荷,但还是不能全面准确的反映IT运维人员真实的工作绩效。因此,IT运维人员绩效考核机制是要进一步完善的。不但需要参考同行和同业的好的做法,更要由考核部门和管理部门一起深入配合和实践。

1.4.缺乏IT基础管理工具和系统

基于OA系统,再加上财务、CRM、业务系统等构成了公司的核心运营系统。这些复杂的核心系统是企业整体业务顺畅运营的关键。但作为支撑核心系统运行的IT基础架构和运维系统,很多企业并没有配备。现有的IT管理工具偏重于技术层面的故障发现及预警,对于发现的事件虽有相应的管理流程汇报,但仍未找到合适的工具为其提供全面、安全、稳定的运行支持。在ITSM这一块,有相当大的缺失。

1.5.缺乏有效和完善的配置项管理数据库(CMDB)

目前企业的IT运行维护仅有对核心应用系统相关IT设备的简单梳理,虽然收集了部分配置项信息,但是当前仅限关键业务的、缺乏工具支持的、简单的CMDB建设,已经很难满足未来企业IT信息化的高标准。CMDB的建设不是一蹴而就的,不仅需要详细的配置项属性数据和准确的相关信息,而且还需要一个科学有效的配置管理模式及工具系统予以支持。

1.6.缺少面向IT使用部门和个人的运维服务报告

IT运维管理对核心系统的运行提供固定的IT服务报告,如:系统运行报告、工单处理报告、满意度报告、SLA报告、周/月/季度/年度报告等等。但由于IT管理报告的内容多以技术语言提交且仅限部门内部和少数领导参阅,IT事件的提交者暨IT使用者却无法得到相关的事件处理报告。作为外部用户的业务部门不仅无法接触,而且受专业所限难以理解,无法充分利用IT管理报告提供的信息。在IT运维部门从成本中心向利润中心转型的过程中,IT运维面向外部IT使用者时不能再以晦涩难懂的技术语言提交IT管理报告,而应采用符合一般用户阅读需要的IT服务报告,实现IT运维的“服务于用户,为用户所用”的目的。


二、IT运维的建设思路

IT运维管理应当时刻保证企业信息化网络的正常运转,同时保障信息的完整性、可用性和保密性,实现高效运维管理。

制定高效运维机制的主要思路有:

2.1.合理的用人策略

一个高效的IT运维部门应当进行合理的职责定位,实行网格化岗位分工,有效的避免单点故障出现时可能出现的风险,实现人力资源的互为备份。采用科学的人才激励机制和KPI考核机制,坚持“以人为本”,做到“以待遇留人、以感情留人、以事业留人”,提高运维工程师的待遇,补充新进技术人才。同时进行管理模式的优化,可按照地域范围,组建分片的运行维护中心,增强运行维护体系的专业性.

2.2.规范的运维制度

应当健全部门管理制度,使日常的运维工作流程化,职责角色清晰,并加强对危险的防范意识,对安全建设具有完整的规划和加固方案对于各种安全防护产品能够综合应用,从而能够使整个系统保持在相对稳定安全的状态。IT运维工具和系统应当能够提供可视化的运维仪表盘,对全局进行监测,并可根据累积的数据进行分析和趋势预判。

2.3.高效的流程管控

完善IT运维服务平台的建设,开通运行运维支持系统和知识库平台。同时IT运维人员也应当增强服务意识,将服务理念引人IT运维管理的建设,对每一个工单的处理,都实行负责机制。优化IT运维流程,引入扁平化管理模式制定有针对性的培训计划,既要兼顾IT技术和IT架构的发展,又要考虑到实际的需求。同时对企业员工的IT技术和IT知识加强培训,提高整体的运行水平;以需求为动力,建立积极的运维服务理念;改变谁负责谁培训的方式,突破技术局域性限制,提高IT运维的效率。

三、总结

加强IT运维管理理念,制定合理的运维策略和流程,可以从根本上提高IT运维效率,一方面可以提高企业的安全管理能力,杜绝信息泄露、网络攻击等信息安全问题,保障企业的安全运转,另一方面,作为企业业务能力的一部分,规范化和稳定的运维管理可以有力的支撑企业的日常经营,提高企业的核心竞争能力。可以这样说,好的企业一定会有一个好的IT运维部门,有志于提高竞争力的企业一定要在企业的发展阶段就制定出适合自己的IT运维策略。