原文:《企业如何将运维“被动”化为“主动”?》

传统的运维方式给人的印象是:故障发生前,维护人员似乎无所事事;故障发生后,则是手忙脚乱。这就是被动服务给人们留下的印象,运维人员是在被动地等待故障的发生。在新的运维系统中,我们必须改变原有的运维方式,变被动服务为主动服务。

维修2

在主动服务模式下,运维人员主动地巡检发现问题,主动的监控系统的变化,对日常工作及故障处理完成后主动进行问题分析,对系统的变更风险进行评估。在新系统中,可以通过种种技术措施,使得运维工作从被动服务转移到主动服务,如:增加变更管理流程以防范变更风险。

随着IT运维管理技术的不断进步,数据处理便捷的同时又面临着另一个令人头大的问题,成千条警告信息堆积在一起,问题的根源在哪,根本没法判断。虽然不少产品提供了告警过滤和压缩,但结果并不尽人意。

“主动”运维并不是一个新鲜的概念。

几乎所有的产品、用户、理念都在宣扬“主动 ”。从被动到主动管理,是每个企业针对信息系统如何提高IT服务水平、提高系统可用性、降低运维成本、提高客户满意度,实现IT信息化的过程。企业在选择IT服务管理工具的最终目标就在于运维“主动”,实际上真正能够达成IT与业务融合的少之又少。在以往的企业IT运维工作中,传统被动式运维和类似“救火员”角色的IT系统运维方式,根本不能满足企业的需求。

在虚拟化、大数据等新兴技术的刺激下,IT正在走向一种整合的发展趋势。

当然,这种整合并不局限于几台服务器的集群或组成一个数据中心,而是更多地指向了有序、有效地集中,同时也就会导致原有的问题随之集中在一起。在“集中之后”,企业不但需要发现业务系统的问题,更需要联动式解决问题的办法,实现减少问题发生次数的目标。将IT基础架构由错误引起的事件和问题对业务的负面影响减到最小,并预防这些相关的事件、问题和错误的再度发生,这才是主动管理的精髓。

对于IT系统的主动管理,是实现业务服务管理中最重要的基石之一。

一部分用户在改变现有的IT服务管理目标是比较盲目的,因为原先没有一致且正式的运维程序与原则,因此根本无法拟出服务等级(SLA)。如果没有 SLA,实现业务测量运营绩效与确立IT目标几乎是不可能的,也就不可能为主动管理排出精准的规划。

所以IT管理工具应将业务放在第一位,设计的核心以业务指导网络运维,以用户可以通过运维平台提高运维效率,节约运维成本为目标。使IT运维“随需而变”,这样才能使运维完成从“被动”到“主动”的蜕变。

ITIL服务全景

在日常运维工作中,变更工作是在所难免的。例如,新的系统安全漏洞被公布,为了保证系统安全,就需要安全系统补丁,而这种变更给系统带来的风险则是难以估计的。例如在安装补丁后,有时会产生大量莫名其妙的问题。这么一个简单的例子已经可以说明,如果没有很好的风险防范手段,系统变更将给我们的日常运维工作带来大量的问题,后果往往是难以想象的。在新系统中,我们可增加变更管理流程。在变更管理流程中,变更方案需提交变更经理,由变更经理组织由专家组成的变更顾问委员会(CAB)对变更进行风险评估,在评估通过后才能够进入变更的实施过程。变更管理是防范变更风险的最好办法。

当然,主动服务是一种理念,在这种理念下,我们可以定义更多的流程,如问题管理流程,对系统中存在的隐患问题进行挖掘,防患于未然。总之,我们应该树立这样一个理念,在各流程的定义中进行运用,主动地提早发现系统存在的风险和隐患,减少突发事件的发生。


再说,基于ITIL的主动运维服务体系建设

我们常说,IT运维人员要有危机意识,明白有可能出现哪些问题,出现这些问题后该如何去迅速处理并避免后续再次发生。

也就要求IT运维人员要有处理问题的能力,同时作为IT运维服务商要有意识的去培养工程师处理问题的能力,并通过工具或管理来避免问题的发生。

为了做到这一点,同创双子通过巡检与事件记录等手段,将主动运维发挥出来,真正实现IT与业务的融合,保障企业业务高速发展。

01

建立统一报修入口

同创双子设立全国统一报修入口,负责响应与处理客户的各种 IT 问题,将其作为统一的受理入口,收集第一手的问题,同时不放过任何一个问题的最初细节状态,将问题全面记录。

你以为我们只是简单的将问题做记录吗?记录的目的其实是方便做总结,为客户提供全面、详细的服务报告,提出问题复发与根除的整改措施与方案。

多任务

02

做好定期巡检

巡检并不是走个过场,巡检的目的,是为了提前发现问题,避免IT故障的发生。

其实要想做到“主动”就必须要有洞察能力,明白这个设备今天处在什么状态,明天如何能够提升到更好,所以我们每次巡检都做到记录在案,针对每次巡检结果,出具巡检报告,巡检过程中发现异常情况及时通知客户,根据客户需求,定期产生统计分析和趋势分析报告,支持客户高层领导决策。

IT11

简单来说日常巡检对于企业业务的提质增效起了很大作用。

如果我们能够把运维的日常巡检看做天气预报,可以提前预报可能到来的暴风雨,可以提前获知潜在的风险,并且把被动式故障处理变为主动式的风险预防,那对于企业来说,发现故障的概率就会缩小很多,运维的价值也就发挥到了最大。

不难发现主动运维是影响业务的首要因素,以用户可以通过运维平台提高运维效率,节约运维成本为目标。使IT运维“随需而变”,这样才能使运维完成从“被动”到“主动”的蜕变。所以同创双子在服务过程中更是主动出击,扩大主动运维的影响,将主动运维发挥到极致,让IT与业务达到真正的融合。