腾讯互娱崔晓春:运维的下一站在哪里?从马镫说起
2016-03-30 14:18:00 来源:来源:高效运维 评论:0 点击:
51CTO首届中国APP创新评选大赛正在招募>>
作者介绍:
崔晓春
腾讯互娱运营部总经理
腾讯游戏运营技术总负责人
腾讯首款自研MMORPG《幻想》的主程序之一,《QQ三国》前期制作人。他也是腾讯TBOSS 实时交易系统和腾讯分布式数据仓库TDW的总架构师。
目前,他正率领团队致力于数据挖掘和自动化运维在游戏运营的应用落地,推动游戏运营智能化。其中蓝鲸平台,已成为业界自动化运维的新标杆。
演讲正文
作为GOPS2016全球运维大会的荣誉顾问,崔晓春先生亲临现场,并在开幕式上发表了题为《从马镫说起》的演讲致辞,从人类历史的宏观角度回顾了工具进化的过程,并对未来技术运营可能步入智能化时代做了展望。
先做个小调查:有人骑过马吗?
马镫改变了人类的历史
如果你骑在马上面但是没有辅助工具的话,会很难受,更谈不上纵马驰骋。
自从马镫出现了之后,可以让人马合一,而且将人的力量充分地发挥出来,人可以在马上射击、拼杀、刺杀等等,各种动作都可以做出来了。
这时可以给骑马的人重新换一种定义:【骑兵】。从一般的骑者变成了骑兵,然后很多很多的骑兵又演变成了一种新的兵种。骑兵出现之后步兵就很难打赢骑兵了,占的胜算是绝对优势的。
马镫是在中国发明的,在汉朝用强大的骑兵赶走了匈奴之后,匈奴被迫从亚洲向欧洲迁移,它顺道把阿兰人给灭了,而阿兰人则把马镫带到欧洲。
骑士团和十字军东征,这些现象的出现改变了欧洲当时中世纪城堡的思维模式。在东征到土耳其的过程当中,发现东方文明的神秘之美,这个时候触发了文艺复兴,之后就是大航海时代开始了。
由此可见,一个小小的工具:马镫,解放了骑者的双手,赋予骑士新的定义,从而产生了巨大的变革。运维,我想也是这样的。
运维的发展史
对比一下人的发展历史,从蛮荒时代到青铜器,到现在的据说德国已经实现了工业4.0。
那么,运维跟这个有什么关系?
运维的第一个阶段就是通过工具实现简单的、重复的工作,比如将一个文件传到另外一个服务器端去,要输入用户名、密码,这是手动的。
那么,如果我写一个脚本,或者一个工具的话,可能只要敲一个回车就可以搞定了。此时就从蛮荒时代到了工具时代,这时候运维才有一点点新意。自从将运维的双手解放出来后,就有了更多的思考优化时间。
业务越来越复杂,单个工具不够。可能我有很多定时的任务,同样的,我也可以让脚本定时地自动化去做,比如凌晨判断是否需要清理硬盘空间,就不需要每天到时起床敲一堆命令来完成这些工作,这就是简单的自动化。
这个时期的代表之一就是业务的自动化扩容和缩容,它极大地提升了运维同学的生活质量。
运维同学在不同时期做了很多工具,写了很多脚本,开发了很多系统,但是他们可能会遇到一个同样的问题:接口不统一,规范不统一。
你写的东西我看不懂,这样就出现了一个新的名词叫“云”。
从IaaS到PaaS、SaaS,大家做了很多工具系统,比如Docker等各种云都出来了,屏蔽了由于不同的接口造成低效率和重复的错误,让运维的质量和效率都得到进一步的提升。
到此时相当于工业2.0和3.0之间,下一个阶段是什么呢?
我觉得下一个阶段可能是【智能】。
无AI,不运维
最近大家都在看一个围棋的比赛,人类的冠军虽然下出了“神”的一手,但是也没有办法阻挡他输给机器人。
今天我们要考虑的问题不是机器人最后能不能统治人类,我们要考虑的问题是AI已经来了,运维该怎么办?
在遇到报警的时候,一般人先做的工作可能是先连上网,看进程是不是有问题,看内存等等是不是有问题,看网络是否有问题,再看看日志有没有什么错误信息,再进行处理。
我们如果有一个机器人,把人类刚才做的这些动作在脚本里实现,将我们日常工作的一些流程优化之后再串起来,加入机器学习能力,通过大量的用户行为的日志数据进行判断和收敛,看看是否因为哪些地方的IDC出现了问题,导致了其他接口的调用失败、没有办法登录,所以出现了报警?从而迅速处理。
所以,解放双手之后,又迎来下一个划时代的阶段:AI的时代。
最后,感谢大家来参会!我也想借此机会,跟大家互相学习,互相探讨。
在我们的运维工作中,我们不仅仅是高效地完成发布变更故障处理等等基础运维工作,还可以提供很多增值服务,我们还可以做一些诗与远方的事情,我们的价值还可以得到进一步的提升。
谢谢大家!
【编辑推荐】