运维自动化的困境和价值

发布时间:2019-02-01 15:40:08 点击数: 13

1:运维自动化的困境

     谈到运维自动化的困境,我觉得要带着两大行业特点去看待这个问题,一个是互联网行业、另外一个就是传统行业。这两个行业面临的运维自动化的困境完全不同,普遍的共性是运维研发资源能力的不足。

       对于互联网行业,业务的发展速度很快,底层运维自动化能力可通过IaaS公有云来解决。在OS之上的运维自动化,则是通过一些开源工具来解决的,比如说Puppet、SaltStack、Ansible等。大部分都是以开源工具为主,开源产品的引入,也在不断加大维护的难度和复杂度,带来的另外一个问题就是平台可扩展的能力非常弱。所以一般成规模的互联网企业,最后都走向了自研的道路。不过有利于互联网行业运维平台建设的条件是互联网的基础比较标准,在硬件和软件的差异上不像传统企业那么大。

       对于传统行业,业务的互联网是瞬间展开的,另外传统的封闭式系统架构也走向了开放式x86架构,导致运维维护的基础设施对象和上层的业务对象提升了一个数量级。而传统企业的运维手段之前都依赖于商业产品和人肉运维等方式。

       无论是成规模的互联网企业还是传统企业,在业务的倒逼之下,运维的突破力都是不断向前的,但是这个整体的规划蓝图是什么样的、实施路径如何、需要什么样的方法论,则需要有一个全面的解答。


2:运维自动化的价值

谈到运维自动化的价值,运维人员应该很容易就能达成我所说的如下共识。

首先是效率的提升、人力的解放,通过工具或平台来提升人均的运维效率和产出,比如说之前通过人肉发布一天只能发布10张单,现在通过工具,一天可以发布100张单。

其次提升了产品的交付效率,提高了业务的竞争能力。快是制胜的法宝之一,如果你的产品推出得比对方更快,那么你就能更快地接触到用户或客户。

还能提升产品的质量,通过工具不断去提高持续交付链上各角色的能力,比如说测试组的自动化测试、配置管理组的持续集成服务,等等,通过能力的整合,不断提高软件交付的质量;还有在发生故障的时候,能有更快的恢复手段来确保故障的恢复,也是质量保障的一部分。

最后运维自动化的收益是成本的节省,一种是最直接的人力成本的节省,可以让更少的人做更多的事情;间接的成本受益是把很多运维经验固化成平台的经验,从而减少了整个交付链上的文档化内容的输出。



标签: 自动化运维