原文:《企业数据中心如何高效做运维?》

数据中心如何高效运维?只有自动化运维才是高效运维吗?运维至少从目前来讲,还都是靠人来驱动的。如果运维工作安排合理,结合一个不错的运维管理系统,其实同样可以实现高效运维。今天我们就数据中心如何高效运维来展开点讲解下。

首先,在做数据中心网络运维前要做大量的准备工作。不管是新手还是老手,都需要对数据中心的网络构成、业务走向、设备互连关系等了如指掌,这些数据要熟记于心。平时多看多记,将这些数据通过表格整理好,便于随时查找,对于任何一次网络变更都要做记录,并及时更新这些数据,确保这些数据是准确的。




常用的网络操作命令要反复记忆,不同设备的命令千差万别,无任何规律可言,没有太好的办法,只能死记硬背。如果遇到了突发故障,或者领导要求紧急变更一下网络,这时还需要去查找各种网络资料,对应用配置不熟练,这不是很好的运维技术人员。这一点说白了就是需要运维技术人员要能吃苦,要耐心,对数据中心网络环境相当熟悉。

我们知道领兵打仗就要对地形非常熟悉,网络运维也是如此,要对整个数据中心网络环境非常熟悉,将整张网络都印到了脑海里,否则掌握再好的网络技术也无的放矢。

其次,网络技术是一个大染缸,仅网络协议就有数百种,再加上不同网络设备实现上的差异,一个人要掌握全部协议根本不可能。所以网络运维技术人员一定要懂得抓“重点”,纵然有很多网络协议,但是因为要适应各种各样的场景,在一个特定的数据中心里一般只要两三种网络协议就够了,所以只要将自己数据中心需要的网络技术吃透、玩精通足矣。

比如早期的数据中心网络基本靠OSPF、BGP、VRRP、LACP几大网络协议运转,掌握这几种协议就可以吃遍天下的数据中心。如今,数据中心技术也在不断发展,VXLAN、TRILL、虚拟化等技术都涌现出来,掌握了这些新技术依然可以让数据中心充满活力,所以数据中心网络技术人员一定要以自己的数据中心为基础,吃透自己数据中心所用到的各种网络协议技术,不管哪种协议出了问题,都能按照自己的理解去排查问题,有一套应对的措施,而不是乱做一团,不知所措

再次、数据中心与网络设备商关系非常重要,数据中心运维技术人员对网络技术再精通,也无法了解到网络设备内部的实现,很多时候都需要设备商来分析问题,给出答案,所以要善于与网络设备商打交道。

作为甲方,运维技术人员有权力向网络设备商获取关于设备内部各种功能实现、配置手册、操作手册等资料,有了设备和资料,一定要认真学习,有疑问的地方及时向设备商人员咨询。当然设备商也会考虑自己的利益,服务也是要占用成本支出的,为了能获得更好的服务,数据中心也应该适当地购买一些服务,比如设备巡检服务、维保服务、原厂工程师驻地服务等,购买这些服务的好处就是可以得到及时的技术交流。在出现一些重大网络问题时,可以得到设备原厂工程师的积极响应,调取备品备件。并帮助数据中心迅速恢复业务


最后,数据中心网络不是静止的,一成不变的,网络技术也在不断地更新与发展。现在的网络设备和电脑一样,过不了三年就面临着淘汰,所以数据中心要想不断进步,就需要掌握新技术,学习新知识。作为网络技术人员,要有全球化的视野,掌握世界最新数据中心网络技术动态,每一个数据中心都有着自己这样那样的问题,很多问题都要未来的新技术来解决。为了提升数据中心的竞争力,引入新的网络技术是一个重要手段,所以网络技术人员应该多出去走走,向周围优秀的数据中心学习,与数据中心运维技术人员进行多交流,虽然可能不是同一个数据中心的,但时常也会面临相同的问题。总之,数据中心运维技术人员要多看、多学。