优秀的运维架构师应该具备哪些能力?(1)
2016-02-20 19:34:14 来源: 苏君福 高效运维 评论:0 点击:
作者介绍
苏君福(Jeff)
10多年运营管理及系统架构规划经验,擅长ITIL企业实战。现任全时企业社交平台总监一职。
合格的运营式运维工程师
首先,我们总结下,关于谈到何为一名合格的运维运营工程师,大概就是几点:
具备一定运营技能;要有运营意识;主动性要强;学习能力要跟得上。
大家都会发现这些条件基本是主观性方面的占的多一些,而与客观沾边的貌似只有一点:学习能力问题。运营技能差可以培养,运营意识差可以培养,主动性差也可以受环境影响,可以熏陶。
而学习能力完全是一个人综合能力的体现,这一点个人觉得客观性占绝大部分。最近发生的一系列事情,我颇有感触,合格与不合格的运营工程师就差在这里。接下来,我就简单的跟大家分享一下。
回归到我们OPS生产线运营中来,大家分析一下自己的工作经历,都会发现我们之前做过一些“傻事”,比如:
运营过程中RM掉lib目录及关键的数据文件目录;Drop掉数据库,甚至就连自己远程管理的服务器,比如做一些安全策略等导致自己也连接不到自己的服务器,诸如此类。
这些都是大家成长的过程,通过时间的推移,我们都能吸取教训并总结经验。可以说大家都会经过“0”和“1”的过程,这些貌似我们都没有什么区分。
但是,大家有没有总结一下,“1”到“N”的过程,大家静下心来仔细想想,自己的“N”是个位数或者是十位数或者甚至是百位数,你会觉得有哪些感触呢?
我想里面就能体现你的经验,更重要的是从这些经验中学到了多少知识,这些将成为你的综合能力素质。
优秀的运维架构师
回归我们的主题,一名OPS架构师,学习能力占了主要一部分(其实其他行业包括任何事情等等这都是关键一点)。如果这块缺失,仅凭一些生产线的经验教训,而不去反思,并从中总结出更多的经验来,想成为一个架构师那都是不现实的。
那么优秀的OPS架构师我个人觉得有四部分组成:
1.具备一定的沟通和协调能力;
2.具有突发故障应急处理能力;
3.要有不断反思的能力;
4.要有很强的知新能力。
下面我们来具体说一下。
1.沟通和协调能力
具备一定的沟通和协调能力,这个跟性格有关系。但是,做OPS久了你就会知道,如果你还没具备一定的沟通和协调能力,那么趁早撤出这个行业,因为这个职业不适合你。
我们从OPS的ITIL管理可以看到,几乎每个流程都是需要沟通和协调的。就拿最基本的变更管理来说,所有的产品上线最后一个关口就是要进入到生产线部署。
那么,如何协调好研发和测试等资源?做到合理的安排及变更过程中的井然有序?这个完全是OPS的架构师或者说运营工程师来驱动,他会影响变更的成败。
所以,如果每次变更总是有问题,那么就要找找自己的问题,这个跟技术能力没有多大的关系,关键在于你是否具备的沟通和协调资源的能力。
2.突发故障应急处理能力
具备一定的突发故障的应急处理能力。这个要求比较高,其实,这个能力主要有两个体现:要有一定的技术能力;要有生产线运营经验。
技术能力,后天个人不断学习去获取;而生产线运营经验,这些都是血的教训得来的,这个就是之前我们说的“N”,不过,并不见得“N”越多越好:
而是“N”中,所有的事故或者事件类型的都不重复,或者说相关类型的不能重复,这是最好的。
也就是,我们要从之前教训中不断学习和武装自己,让自己变得更强大,每当有新的问题发生或者降临到你的身上,你具备快速的处理事件的一二三理念,很好的运用事故处理的343法则,这是应急处理的能力的关键点。
作为一名优秀的OPS架构师,毫无疑问以客户为导向,服务可持续性为宗旨,要做的事情就是,快速恢复服务,后续排查问题。这个看得简单,其实在实际运营中,往往被大家疏忽。所以,这点看,你是否具备了。