原文:《做运维管理需要注意的问题有哪些?》

作为一个做过多年的IT运维的人来讲,刚开始在做IT运维管理时,遭遇各部门人员的投诉和不满,整个人都感觉不好了,慌乱在于,不知道其中的要害到底在哪。在经过多年的经验总结和智能化利器的协助下,一切都开始变的井井有条,现在根据行业普遍存在的问题,进行总结一下IT运维管理中经常遇到的问题,供大家参考和注意。


一、IT运维管理可能存在的问题


1、设备种类繁多、管理地域分散成本控制验

单位IT系统涉及的设备种类繁多、管理地域分散,IT服务水平远远跟不上企业规模的扩大。系统常需要在根据用户的实际应用需求进行个性化定制,这将需要用户为系统的二次开发的工作流支付一笔额外的高昂费用。而且在定制后的强工作流模式的系统使用中,用户还是会发现它操作不够灵活,影响了事件处理的及时性,改得多了就失去运维系统其原先本身的目标与价值,致使IT运维成本失控


 2、IT运维机制不完善,流程操作层面缺乏统一

 没有建立起稳定、规范的IT运维机制。现有的IT运维流程的操作层面缺乏统一。如事件单提交之后,事件预判和优先级的设定缺少统一、规范的指导文档,仅以人员的主观经验或约定俗成的方式指导事件的处理过程。有识别但无规范,有处理但无管理,有人员但忙于救火,有工具但支持力度不足,直接影响维护体系的效果。


 3、经验不少,知识不多,过度依赖核心人员

在实际工作中积累的、有价值的经验仅存在于头脑之中,未能作为书面的知识记录规范地保存下来。经验始终无法共享,一些技术性问题只能依靠核心人员解决。


4、IT运维的绩效考核机制尚不完善

主观的绩效考核难执行,客观的绩效考核难制定,模糊的绩效考核难见效。


5、IT基础架构管理工具欠缺

基于门户、财务管理、采购管理、人事管理、文件服务等构成了公司的核心业务系统。这些复杂的核心系统保证了整体业务的顺畅运行。现有的IT管理工具偏重于技术层面的故障发现及预警,对于发现的事件虽有相应的管理流程汇报,但仍未找到合适的工具为其提供全面、安全、稳定的运行支持。


6、缺乏有效、完善的CMDB

仅限于关键业务的、缺乏工具支持的、简单的CMDB建设很难满足今后全面实施信息化的需求。


7、缺少面向用户的IT服务报告

运行维护室对核心系统运行提供固定周期的IT管理报告,如:系统运行报告、机房环境报告、备份报告、年度报告等等。但由于IT管理报告的内容多以技术语言提交且仅限部门内部和少数领导使用。作为外部用户的业务部门不仅无法接触,而且受专业所限难以理解,无法充分利用IT管理报告提供的信息。


二、加强IT运维管理的措施


1、通过IT流程处理模式,简化事件处理流程

Servicehot ITSM通过IT流程处理模式,简化事件处理流程,为业务部门提供的IT服务与支持更为及时和高效。平台快速记录工单申报,建立工单的处理级别和对应的负责人,快速区分工作职责及优先级,工单处理流程图记录全程操作过程,并进行下一步指引工作,最终形成报表数据,方便对工单进行有据可查及对下属工作进行考核,通过知识库获取已有的解决方案,从而帮助运维人员及时处理当前故障。同时结合资产和合同的管理,提高资源的可用率,使得资产的信息一目了然。实现“四化运维”的价值:运维管理制度化、运维内容明细化、运维服务流程化、运维专家虚拟化


2、建立统一的IT运维管理体系,完善并规范IT运维流程

参照ITIL最佳实践并结合公司的实际情况,将IT运维管理规范化为一系列标准流程,包括服务台、事件管理、问题管理、变更管理、发布管理、配置管理和服务级别管理等。然后通过IT服务管理工具将各个IT运维流程集中在同一个平台上进行管理。基于标准的流程体系和统一的管理平台,与IT运维相关的资源(包括部门、人员)得以有效整合,并采用相互识别的“相同语言”进行深入、充分的沟通,提高生产效率和信息传递的及时性。


3、建立基于IT运维管理流程的IT人员绩效管理和激励机制

根据公司全面实施信息化的要求,建议运行维护室组建具备完善的专业知识和管理能力的IT运维管理团队。因此,建立与IT运维管理系统流程体系相符的人员绩效管理及激励机制显得尤为重要。建立量化KPI,对包括服务效率及服务质量等多方面进行业绩考核。通过IT运维管理系统平台,对IT运维人员的工作进行数量和质量上的记录、统计和分析。在基于ITIL流程明确IT人员岗位职责的基础上,定义关键考核指标并通过IT运维管理系统收集数据,进行整理、分析产生绩效报告,最终实现IT绩效管理的信息化。


4、提供面向客户的IT服务报告,为业务部门和IT运维管理提供决策依据

参考ITIL及ISO20000的最佳实践,可建立专门的工作流程对IT服务报告及IT运维服务管理信息作进一步的完善。实现向客户或业务部门以“客户化的语言”提供约定的服务信息,同时也能为内部IT运维提供有价值的管理信息。如:某个时间段内那些方面的故障出现的数量最多;那些方面的故障解决的效率最高或最低;IT维护人员的工作负荷统计;问题分布在哪些系统或设备等。这些服务信息统计,能帮助IT运维管理和决策部门进行决策和趋势分析,从而做到对IT系统中的各类问题和相应的服务状况进行全面掌握和了解。


5、支持经验和知识的共享化

提供丰富知识库和完善管理。用户通过知识库,如FAQ、关键词检索等,可以初步搜寻解决方法,这样问题就会以最小的资源开销和最快的处理效率得以解决;IT维护人员通过知识库及时、准确地选择解决最优方案,可解决大部分常规问题;资深运维人员、专家,可以根据故障发生的频度,把经过实践证明正确的解决方案形成知识库,供其他运维人员使用;另外,相关应用系统的业务处理人员可以通过共享的知识库或实践指导库,提交或者获取相关业务处理的知识。


6、建立并完善CMDB

实现用户、资产、以往问题的历史记录等可查询、可追溯IT运维管理系统通过组建CMDB对用户信息、资产信息进行记录和维护,并把每个事件/问题与用户以及发生故障的资产对应起来,形成历史记录以便查询和借鉴。如:某个用户报告某路由器通讯故障,维护人员就可以根据资产编号查询到该路由器以往的故障状况。如该路由器出现过多次故障,并且都是线路质量较差,维护人员则可以根据这一依据向有关部门提出线路维护申请。


7、推行服务级别管理,提高客户对IT运维的服务满意度

在“内部市场化”的要求下,最终用户的服务满意与否将成为IT运维质量的考评尺度。为此,推行服务级别管理有利于明确用户/客户的业务需求并使之规范化、标准化。因为只有在服务双方都认可的服务范围内提供合乎需求的IT服务才能最终获得用户/客户满意的评价。比如:故障的响应时间约定、备品备件的替换原则、约定的设备巡检日期等。通过服务级别管理不仅可以提供清晰、规范的IT运维服务,根据服务级别管理的流程可以对服务的结果进行持续改进。




Servicehot介绍:

永服科技有限公司(简称“Servicehot”或“永服科技”),提供Servicehot IT服务管理平台(Servicehot ITSM)和Servicehot IT服务运营管理平台(Servicehot ITSOM)产品,基于J2EE搭建的架构平台、可以适应云计算部署环境,具有较好的易用性、扩展性以及配置功能,适用于公司目前IT服务过程不断改进、提升,业务逻辑及流程复杂等环境的要求,并且在大型的国企、制造业、金融等企业完成了实际的应用和推广。

ServiceHot运用ITIL、ISO20000等最佳实践方法,结合ServiceHot在国内外众多行业客户的IT服务管理、信息安全管理方面的成功实施经验。协助客户设计并通过ITSS、ITIL、ISO20000等国际认证,帮助客户提升IT服务管理水平和竞争力,提高IT服务效率,强化人员考核,加强对供应商考核,提升客户满意度。

永服科技是中国优秀的 IT服务管理解决方案服务商和产品厂商,注册资金5000万,是国家IT服务标准ITSS工具组副组长单位,参与国家IT服务标准的编制和评审。其制造业和金融行业为主要客群,金融业案例包括:XX省农信、国信证券、郑州商品交易所、深圳证券信息、阜新银行等多家省级和地市金融企业;制造业客户包含:四川长虹集团、中国移动、云天化集团、天原集团、华为等大型国企或制造业企业。其产品和同行业内IT服务管理项目的实施经验有利于提升公司IT服务效力、降低IT运营风险,为信息系统安全、可靠、高效地运行提供有力的保障。