公司动态 行业动态 安全通告

企业级运维三板斧:运维的价值、效率与能力呈现

日期:2017-11-28 09:45:57 投稿人:杨锦林

说到运维,大数据时代的运维面临“业务、规模、团队”三大难题多种压力,这让我们一谈到企业IT系统的运维,往往总是想到被动救火、背锅不断。我们的运维工作到底怎么做才能将风险扼杀在故障发生之前?如何能够摆脱繁琐、低效、高风险的传统人肉运维方式?如何能够更直观的在公司呈现我们的价值和存在感?这些难题,在AIOps被广泛提及的当下变得尤为迫切。

那么,作为运维人员,我们应该如何主动寻求变革呢?新炬网络董事、副总经理程永新在全球敏捷运维峰会说到就是“企业级敏捷运维三板斧”,也就是可视化呈现价值、自动化解放效率、智能化驱动能力。

企业级运维三板斧

1.可视化呈现价值

在软件市场,国内和国外有很大的区别,国外的软件可视化做得其实没有国内好,因为国外所有的这些软件叫工具软件,这些工具软件是给干活的人用的,所以国外的这些工具软件不管是开源的还是商业的,其实做得没有那么好。但是国内不一样,国内企业的领导更希望看到的是:你说我出问题了,好,我要看哪里出问题了,纯技术层面你可能会发现,解释半天也解释不清楚,所以这时候,可视化就变得更为重要了,一方面是我们操作人员自己本身工作是需要的,另一方面关键是在客户端,在领导那里怎么样呈现这个价值,我们的工作怎么能被看到,这很重要。

1511833356528860.png

在可视化层面,我们的做法是通过纵向打通应用层、平台层和设备层,横向接入全网IT设备,采集全网数据,并在此基础上结合具体的算法去做展现的。

比如通过自研的打分形式具象呈现所有设备的健康度,便于用户第一时间发现、下钻和解决问题;通过自研的APM 应用自动埋点,实现交易过程的透视,并对相关数据进行分析和存储,实现调用过程分解及性能问题的快速定位等。真正实现了随时随地、全网透明的可视化,支持APP、Web工作界面和大屏展示等多屏呈现工作内容与价值。

2自动化解放效率

自动化解放效率这个不用说了,对于我们运维来说,如果我们能多出一些时间看书、学习、研究,我们自己的技术能够有点提高,这个对我们来说是最好的事情,而不是说一天到晚都在做重复性的劳动。

其实自动化我们一直在做,我相信所有做过的人都会知道这中间有很多很多的坑,这些坑我们怎么样踩过去的呢?自动化的主要目的,一是提升效率,二是安全可控,三是降低人员依赖。要做到这三点则必须明白:一切没有固化到平台的标准化过程都是无用功;一切没有场景驱动的运维平台建设都是假大空。

对此,我们的做法是:

1511833468320672.png

第一步,落地八大自动化运维场景,包括自动化运维操作及自动化资源开通及部署等,覆盖90%以上的运维工作场景。

第二步,通过集中式自动化运维管理,实现运维操作的安全、高效,并形成知识资产,确保知识的有效传递。

第三步,自动化运维能力支持API开放:将自动化运维能力封装API,供各系统、各终端调用,如在手机端、系统拓扑上可直接进行运维操作。

第四步,构建自动化运维PaaS平台:支持场景的自定义开发,驱动运维团队能力转型。

3.智能化驱动能力

智能化首先要做的就是日志分析,当设备类型越来越多的时候,日志分析则变得越来越重要。从这个层面出发,我们也是通过自研的IVORY大数据日志分析平台,采用大数据底层框架和拖拽式的独家专利切割算法,实时聚合海量日志,准确搜索统计日志,智能分析日志内容,只需简单操作就能实现大数据的分析和挖掘工作。

1511833537404756.png

此外,做任何运维产品如果没有运维经验其实只是做一个框架,想要真正实现智能化,光有工具是不够的,还需要结合实际运维场景,优化数据价值,以智能化驱动运维能力,最终实现从发现、决策分析到问题解决的问题闭环解决手段。

这个是我们整体的敏捷运维全站的解决方案框架,以“可视化、自动化、智能化”为敏捷运维全栈解决方案的核心:通过“运维可视化”实现随时随地、全网透明的运维价值呈现;通过“运维自动化”全面提升运维服务效率和质量;通过“运维智能化”实现以智能化驱动运维能力。在这个过程中,我们通过运维分层构建,实现不同层级解决不同层次的问题。