建立DevOps体系是当下许多企业正在跃跃欲试的计划,由于其难度较高,对技术的要求也比较复杂,企业在决策之前仍然有许多担忧和困惑。



5.22日,第十六届 GOPS 全球运维大会圆满落幕。本次大会以XOPS为风向标,侧重 AIOps、DevOps、DevSecOps 和运维自动化等技术领域相关热点展开议题探讨,包含众多开发、测试、安全领域的技术议题主要面向运维行业的中高端技术人员。旨在帮助IT技术从业者系统学习了解相关知识体系,让创新技术推动社会进步。通过国内外知名企业的相关案例,也能与国内顶尖的技术专家探讨技术实践,使企业可以根据最佳实践确定自己的选型方案,并提前预估相关的风险和收益,实现技术落地。


优维科技首席布道师薛海涛受邀出席,带来了主题为《如何建立面向DevOps体系的运维能力中台》分享。下面我们来详细拆解嘉宾的精彩分享:


■ DevOps中运维面临的挑战

Operate过程,即:持续运营,应用上线后,保障系统稳定、高效运行,为相应的数字化业务提供可靠有效、有效的支撑。


Monitor过程,即:服务观测,从业务视角到技术视角,全方位感知应用在运行过程中态势变化。在及时发现、定位和处理问题的同时,为业务、产品设计和开发提供持续的反馈,以此驱动软件产品/应用开发的持续迭代。


DevOps体系中的运维,是连接业务和IT技术的纽带,业务结合IT,促进传统运维转向运营转型;随着新技术的演进和发展,企业数字化转型的加速普及,传统IT运维需要同时面临“双态”环境,即:

稳态:保持传统的核心业务系统稳定、可靠运行;

敏态:为新型的数字化业务提供提快速响应能力;

IT运维将从传统的成本中心,转向数字化创新中心,数字化业务运营中心...重塑IT运维的价值链。


DevOps建设过程中,采购/部署/研发了越来越多的与DevOps工具链相关的产品,例如:代码/工具库、CI/CD、CMDB、监控,链路追踪,日志...DevOps工具链变得越来越庞大、复杂,由此导致新的运维和维护问题。多个工具之间,多数是“功能筒仓”和“数据孤岛”,无法平滑的协同工作,实现功能和数据的打通,因此也限制了创新和快速需求影响的能力。

DevOps体系中,运维侧需要建立一套完善的运维中台能力体系,将运维团队经验和知识沉淀为能力与场景,在此基础之上,进行不断的优化和迭代。

■ 从运维监控到服务观测

传统运维监控存在的问题:

○  缺少统一的标准和体系

○  数据复杂多样

○  被监控资源的关系复杂

○  无法及时有效的发现、定位和处置问题


“以应用和服务为中心”进行全方位立体化的运行态势观测,向上扩展至业务,向下扩展至支撑应用的服务的IT资源。重点面向:资源图谱、健康评分、运行分析和事件分析四个维度。


“资源图谱”和“服务观测体系”先行,摆脱传统IT运维监控过程中面临的技术体系各异、数据复杂无序、监控专注点错位等问题。在服务观测过程中,引入“数据治理”相关的概念、体系和方法论实践。


将服务观测数据和告警事件融合到资源图谱中,实现:“故障影响面分析”和“故障根源辅助定位”功能。从业务、应用、服务的全局视角来全面感知观测结果、态势、问题和事件。


构建“告警和事件处理流水线”,告警丰富->告警压缩->告警抑制/收敛->告警通知->事件处置。依托IT资源图谱,IT运维自动化引擎,重新定义传统IT运维监控中“告警”的价值和处理过程。消除传统IT运维监控过程中存在的告警风暴、告警通知错位、告警信息内容贫乏无效、告警处置无从下手等长期困扰一线运维团队的棘手问题。


为了应对日益复杂的技术体系和数字化业务的增长,服务观测获取的指标、日志和链路追踪相关的数据量也急剧增加,因此服务观测系统必须具备实时的流式大数据处理能力,以应对日增TB级的数据处理量。同时,服务观测系统必须具备广泛的数据接入能力,可以顺利的从现有IT运维监控、Tracing、日志等系统中实时获取所需的数据。


 连接IT和业务

要实现传统IT运维向数字化业务运营转型,必须从业务角度的逻辑来重新审视IT技术和IT运维,从业务角度来看IT技术和IT运维,其核心关注点为:

○ 数字化业务的运行态势好不好?

○ 用户在使用和消费数字化业务时的体验爽不爽?

○ IT技术和资源对数字化业务的发展支撑够不够?


构建“数字化业务流程分析”能力,实现数字化业务流程实时、全程可视化,及时发现、定位和处理数字化业务流程中出现的问题,根据业务自身的特征,构建面向业务的数字化运营指标观测体系,为数字化业务的持续迭代和优化提供可靠的数据依据。


“数字化业务流程分析”能力之上,继续深入打造“数字化业务客户旅程分析”能力,通过融合拨测、APM、Open Telemetry、日志等IT运维数据与业务数据,以业务视角实时追踪和复现每一笔交易(每一个事务)所经由的链路。当客户在使用数字化业务的过程中遇到问时,呼叫中心/客服可以快速高效的与技术团队协作为客户提供周到便捷的解决方案。同时,“数字化业务客户旅程”还会成为数字化业务用户体验分析和优化的重要数据来源。



以技术手段不断提升用户体验,持续提升数字化业务的获客能力、客户留存能力和客户服务能力,从而为实现数字化业务高速增长提供支撑,实现从IT技术到业务价值的转化。

■ 低代码技术持续赋能运维升级

面向DevOps的运维能力建设包含五个方面:

○ 数据运维

○ 自动化运维

○ 服务运维

○ 场景运维

○ 智能运维


当核心的能力具备后,接下来要考虑的就是如何持续的沉淀平台能力,如何快速的消费平台能力。借用云计算中的PaaS理念,将基础的能力,抽象并包装为“服务”和“组件”开放出来。运维团队或者运维开发团队成员基于开放出来的服务和组件,通过“所见即所得”和“填写配置项”的可视化编排模式,用服务和组件快速的搭建和生成面向特定运维场景的“微应用”。



作为国内第一个面向运维领域的低代码平台,其核心功能包括:通用服务、数据提供服务、标准化构件、契约网关、契约文档、可视化编排引擎。


其中,标准化构件中,又包含3类构件:原子构建、通用构件和业务构件。标准化构建不仅仅是对技术层组件的封装和复用,其核心目标是:对业务逻辑和基础能力的抽象封装和复用。运维场景千变万化,企业和组织不断加速的数字化转型进程进一步催生了更多的运维场景和运维需求。应用系统开发和交付在DevOps体系的驱动下变的越来越敏捷,高效,而运维侧的运维开发,却依然停留在传统的软件开发模式中。通过广泛采用低代码开发和交付技术,将帮助运维团队降低开发成本,缩短场景化功能开发周期,提升应用开发质量,提高场景化应用需求响应速度。


优维科技在过去的几年中,利用低代码技术开发了150多个面向特性场景的“微应用”,同时将低代码技术和理念赋能给广大的客户与合作伙伴。2021年初将低代码核心组件Next Core和Next Basic开源,以此推动低代码技术在运维领域的长足深远发展,构建更加繁荣开放的技术生态。


想了解优维的DevOps一体化开发平台,请点击:优维一站式DevOps及运维解决方案https://qianhu.wejianzhan.com/site/wjzjxqoy/0e083048-9eb2-47fa-8104-6070377951ffhttps://qianhu.wejianzhan.com/site/wjzjxqoy/0e083048-9eb2-47fa-8104-6070377951ff