原文:《浅谈ITIL之SLA》

在二十世纪六十年代,服务品质协议(service-level agreement)(SLA)是用于达到已定义的服务品质和响应服务问题的一般操作程序,而这些服务问题是用户组织在购买或租用大型机上的机器时间时就已经同意过的。 超大型计算机(big iron)是缺省的企业系统,其它任何技术的处理能力都无法与它相比。当客户机的服务器和网络桌面系统进入计算机世界时,人们就构思出了分布式网络系统这个概念。这些系统后来发展成了跨网络运行企业资源规划(ERP),供应链管理(SCM)和客户关系管理(CRM)系统的企业范围的系统。
 
在这个发展过程中,企业对因特网的依赖已经使得公司的应用程序套件的网络延迟影响越来越明显。同时,用户已经委托一定品质的服务质量保证相关的可用性、可靠性和响应时间以确保业务运转不被中断,并且依赖外部服务提供者来提供应用程序、因特网、网络,受管服务和其它服务。结果,SLA变得更复杂,范围更广,一个用户可以有与不同提供者签定的几个SLA。反过来,提供者自己的SLA也可以是与其它提供者签定的,每个SLA都有一套不同的需求、衡量标准和例外情况。
 
SLA是服务提供者和客户之间的一个正式合同,用来保证可计量的网络性能达到所定义的品质。SLA为服务提供者提供了一种在当今多变而又竞争激烈的市场中胜过对手的方法。服务提供者可能是一个国内的IT组织、一个应用程序服务提供者(ASP)、一个网络服务提供者(NSP)、一个因特网服务提供者(ISP)、一个受管服务提供者(MSP)或者任何其它类型的服务提供者。
 
SLA可以非常笼统或者极度详细,它一般都包含出现故障时服务提供者和客户应采取的步骤。服务提供者保证它提供的服务在一定百分比的时间内(例如,99.9%)是可用的。提供者还能够强制向客户通知SLA当机时间的最长和平均响应时间,或者在网络接口发生改变之前的最长和平均响应时间,并利用基于因特网的工作流自动化、分发和报告技术。如果经过指定的一段时期后提供者无法达到所定义的性能品质,客户就可以获得一些权利和赔偿。各个SLA的权利、赔偿和例外情况是不同的。客户还同意接受协议一般条款的指定例外情况。
 
在每个SLA中都必须精确定义服务品质;否则各方关于SLA将以哪种品质衡量什么服务或性能标准将无法达成一致。例如,一个客户可能认为一个双方同意的服务品质将衡量网络A、网络B和网络C,同时后两者连接到第一个,而服务提供者却认为它只衡量网络A。还有一点很重要的是正常运行时间可用性百分比的小数位数:例如,一年中的当机小时数和当机天数比,99.999%的正常运行时间所允许的当机时间比99.9%的正常运行时间所允许的当机时间还少。SLA应该为客户包含进一个退出条款;当因为不能圆满解决经常发生的可用性、可靠性和安全性问题而使客户的业务运转频繁中断时,客户希望他有终止协议的权利。
 
像任何协议或保险单一样,SLA通常会指定其条款中的例外情况。IT服务的SLA应该包含关于例外情况的详细信息。我将随意将它们分为四类:故障、不受服务提供者直接控制的问题、拒绝服务和预订的维护。只要客户公司可以得到当机期间的适当赔偿,还可以添加其它一些例外情况来适应提供者的情况。通过在SLA中包含进例外情况,提供者可以在出现问题或网络损耗时免负责任。另一方面,如果竞争的服务提供带有极少例外情况的SLA,客户可以选择那些在业务运转中提供更长正常运行时间并且有更好的服务保障的协议。即使99.5%99.9%99.999%这几个正常运行时间可用性保证之间的差别也可以影响选择SLA的决策者。
 
我们去细化SLA,去定义SLA,写明例外情况,如同去餐馆吃饭享受到的服务一样,我们正是通过SLA去购买有保障的IT服务。对甲方而言,SLA可以降低风险,明确厂商、服务提供商、供应商要承担的责任;对乙方而言,SLA是对甲方的承诺,按照SLA菜单提供相应的有偿服务,确保服务持续有效。风险是不确定的,而SLA是去消除不确定的风险,机房的UPS电源、空调、服务器和网络设备,都要有维保合同,厂商提供5*7或是7*24服务,正是由于SLA合同的执行来确保服务的品质。用户的期望值从SLA得出的,SLA承诺提供KFC汉堡,最后供应的是必胜客披萨,那么用户的期望值大大满足,反之,给用户的是麦当劳的猪柳蛋汉堡,用户感觉吃亏了,对服务多半不满意。我们给用户提供SLA的同时,传达给用户SLA能够达到什么样的级别,让用户能够清楚付费的SLA价值多少,3959服务支持差别很大,最终达成双赢。