01

墨菲定律:

幽默又严肃的NASA军规


「墨菲定律」

(Murphy’s law)

任何可能出错的事情最终都会出错


墨菲定律强调了在复杂系统和人类活动中,事情往往会出现意想不到的差错。虽然这只是一种对人类经验和偶然性的幽默概括与启发性原则,并非科学原理,但它却成为人类巅峰科研的一项铁律——在美国宇航局的阿波罗计划控制室中,一块名为“墨菲定律”的牌子被高悬其上,用于提醒工程师们务必高度注意所有可能出错的细节。


02

运维:

墨菲定律的修罗场


“修罗场”是传说中帝释天与阿修罗争斗之地,意指“惨烈的战场”,在佛教中比喻充满斗争和冲突的地方。在优维看来,运维场恰如修罗场,运维就是与不确定性争斗!

 

如你所知,在IT领域,运维团队面临的“斗争”和“冲突”何其多艰——责任之重、压力之大、环境之复杂、变化之快速、故障之不可预测、资源之有限、知识之不断更新……运维人员往往在“困难与挑战共存、错误与风险同在”的常态中如履薄冰,这种可能性不仅仅是系统性的,还常常是动态性的。

 

正如墨菲定律所表达的那个经典的观点,即在一个复杂系统中,事情往往会出现意想不到的差错,所谓“运维差之毫厘,系统谬以千里”,运维这方修罗场可谓险象环生。

 

从字面上理解,墨菲定律似乎是不可战胜的,因为它假设了任何可能出错的都会出错。但在运维实战中,我们可以采取一系列措施来减少失败的可能性,从而“解决”墨菲定律昭示的问题。IT系统由众多相互依赖的组件构成,包括硬件、软件、网络和人员,每一个环节都会引入不确定性,挑战稳定性。

 

因此,运维团队必须7*24准备着,大模型+Multi Agent方案,可最大程度确保运维团队在墨菲定律的“修罗场”中维持系统的稳定运行。


03

大模型的领域化思考:

运维的人格化蝶变


2023年岁末,优维科技基于运维领域多年创业经验重新审视行业,并重新明确“新一代运维核心系统提供商”的企业定位,致力于解决千行百业面临的运维侧挑战。

 

随着大型模型概念的发展和应用的深化,我们也在深入思考和探索:大模型AI如何赋能运维行业?经过与业界的频繁交流,最终明确了大模型的技术应用对优维产品的重要性,并迅速成立攻坚团队启动专项开发工作。

 

2024年3月,优维科技发布《优维大模型解密:从提示词工程到场景应用,剑指AIOps的牛刀小试》,展示了优维科技在大模型应用领域的思考、布局与真实场景对接成果,我们曾在文章中预言:就运维而言,大模型是把“人与系统的交互”变成了“人机交互”,赋予大模型以人格化想象或许才是大模型在运维侧的形态。


04

Murphy:

优维科技自研首款运维AI数智人


此后,我们的产研团队为“大模型运维人格化”这条flag“死磕”多日,目前已取得初步成果:基于优维在大模型领域的经验积累,推出了运维赛道专用AI数智人——Murphy(也是【星际穿越】的女主名字),并围绕Murphy构建了一整套智能体生态系统。



Murphy之名取自墨菲定律,我们希望这位倾注了团队心血的运维数智人能帮助运维组织7*24应对不确定性,从而掌控稳定性。Murphy的出现,旨在利用大模型不断“涌现”的人格化能力,深入理解系统的运作原理,提前识别和预防潜在的故障和风险,从而将不确定性负面影响降到最低。

 

作为一个AI数智人,Murphy可以将优维平台中的数据、文档和API以及行业经验作为语料,通过“AGI+Agent”模式快速拥有智能化能力。Murphy的Multi Agent架构能够快速智能化进化,其效率与稳定性表现均有可观表现——它不仅能够事件处置及故障根因分析,还能够评估整个系统的健康状况。Murphy还能与运维人员进行实时互动,提供智能化的决策支持和建议,帮助运维团队应对各种挑战。


05

大模型+运维:

Murphy的能力“涌现”


现阶段Murphy在运维端的能力“涌现”主要体现在以下几个方面:


  • 运维专家智能:通过深度学习和自然语言处理技术,能够理解和执行复杂的运维指令,分析系统的运行状态,诊断问题,预测潜在的风险并给出预防措施,提供专家级的运维建议和解决方案。

  • 运维编程助手:协助运维工程师编写和优化脚本,自动化日常的运维任务,理解编程语言和相关的技术文档,提供实时的编码建议和错误修正,减轻运维人员的工作负担。

  • 领域专家知识库:集成如最佳实践、故障案例、技术文档等海量运维知识,形成强大的知识库,并根据运维人员的查询需求提供相关的解决方案,帮助运维人员快速定位和解决问题。

  • 人机协同copilot:通过NLP交互模式,大大简化人机交互模式,彻底改变传统UI模式,能够快速通过指令与原有EasyOps平台交互,甚至是其他外部平台,如“查询某某机器负责人是谁”。

  • 深度场景智能:在事件归因和故障根因分析上,引入大模型能力,能够快速集成专家过往经验,做出应急响应和排障响应。

  • 低代码智能编排:低代码引入大模型,大大提升低代码编排效率,研发助手。


在优维开发团队的视角下,Murphy的存在就像是一位永不疲倦的运维专家,如果说IT运维的智能化和自动化水平即将迎来断崖式“飞升”,那么我们有理由认为Murphy将会是一个关键跳板。



06

Murphy18般武艺:

全面打造新一代运维人机协同


Murphy整体体系之内,我们开发了多达数十个智能体,分别是通用智能体、平台智能体和场景智能体,并提供开放的能力让运维自己打造智能体,这一智能体协同和开放架构能大大确保和传统运维能力快速兼容,且可持续进化。


基于Agent的人机协同,就是把Agent当成一个平台能力,并将其作为基础设施建设进行平行延伸,再往后,AI完全可以深度接管平台能力,这几乎是我们团队在实践论证中一致达成的共识(当然,基础软件还是必要的,这个是雷打不动的前提条件)。


在开发Murphy的进程中,我们越是大胆尝试越是觉得不可思议,AI在运维领域展现出来的能力绝非线性,在不断深化认知的进程中,人机协同只是打开了运维“哆啦A梦的奇迹之门”,门后面的世界远远超乎我们的想象。


虽然Murphy只是AI接管平台能力的第一步,但我们的步子迈得也足够大,一出场就推出数十个智能化产品能力,大面积覆盖运维中常见的需求场景,力争为用户带来一步到位的畅快体验。


07

私定即「高定」:

支持本地私有部署,满足各行客户个性化要求


Murphy支持本地私有部署,面向不同的客户提供“私人订制”能力——允许客户在内部服务器部署Murphy,而无需依赖公共云服务。这种部署方式为各行业提供了更高水平的数据安全和隐私保护,因为所有数据和交互都保持在客户的内部控制之下,减少了外部威胁的风险。


例如,在金融领域,遵守如GDPR、PCI-DSS等严苛的法规和标准是行业基本准则。本地私有部署的Murphy可以帮助金融机构满足种种合规要求,允许客户完全控制数据的管理和存储方式,确保不会违反任何数据保护法规。


此外,Murphy的本地私有部署还提供了定制化的服务能力。客户可以根据自己的特定需求和业务流程,调整Murphy的功能和行为,使其更加贴合组织的运作方式。


在性能方面,本地部署的Murphy可以提供更快的响应时间和更高的系统稳定性,因为数据不需要在云端来回传输。在对实时性和准确性有着极高要求的领域,Murphy对于交易业务和客户服务的质量把控起到至关重要的作用。


08

标配即「高配」:

支持云端一体+页面+IM的集成式解决方案


与优维以往的产品特性不同,Murphy在设计和开发之初就考虑了云端一体的交互能力。这意味着Murphy不仅能够在本地私有部署中高效运行,还能够无缝地与云端服务进行集成,从而提供更加灵活和全面的解决方案。


基于云端一体化设计,Murphy可以充分利用云资源的弹性伸缩和计算能力,以应对高峰时段的用户需求。在需要时,Murphy可以快速扩展其处理能力,确保用户体验的流畅性和服务的连续性。实现跨平台的数据同步和共享的能力,对于金融行业中的多分支结构和分布式团队来说非常重要,无论是在移动设备还是PC端,用户都能够获得一致的服务体验,并且能够访问到最新的数据和信息。


在页面支持方面,Murphy智能体能够与各种Web页面进行交互,无论是金融机构的内部管理系统,还是面向客户的在线服务平台,Murphy都能直接在用户的浏览器中提供帮助,解答问题,或者引导用户完成特定的金融交易和服务流程。


同时,Murphy还支持即时通讯(IM)功能,确保它能在金融机构的IM平台上与用户进行实时交流,提供即时的咨询服务、处理交易请求,或者在紧急情况下提供解决问题的办法。


Murphy的云端一体化设计和页面及IM的交互支持,具备为金融等高敏感、高要求行业提供高度集成的AI服务解决方案的能力。


09

优维大模型数智人架构:

基于新一代运维核心系统的技术承载


10

Murphy产品灵感:

优维的大模型改进之旅



我们曾在3月的大模型文章探讨过,优维EasyOps平台矩阵里的几乎每一个应用场景都可以与大模型进行结合,接入大模型的产品有着非常巨大的想象空间。


从某种程度上说,Murphy的诞生是优维主导的一次大模型改进之旅——构建知识库、标注垂直能力、优化提示词工程,不断突破大模型的局限性,最终达成了今天的Murphy里程碑。


灵感分享之一:本地知识库探索


人工智能和人一样,其准确性的提升源自高频的使用反馈,知识越用越好用。


本地知识库检索是构成Murphy本地私有化部署的重要一环。除了支持语雀、Confluence、Jira、流程工单、IM会话等多种知识库的导入,还能无缝对接CMDB数据,支持单表和多表模式则可以让IT信息更好的检索。整合、集成、共享、学习……一气呵成,破除平台和工具的差异化壁垒,形成可无限迭代再生的知识闭环。


灵感分享之二:运维智能化场景探索


CMDB关系图谱建设:运维智能化场景的基石


CMDB关系图谱建设不仅能够提供全面的IT配置信息,还支持各种自动化运维功能的实现,并为更高级别的运维智能化提供了可能。因此,优维团队在规划Murphy的运维智能化场景的进程中,非常重视CMDB关系图谱的建设工作。



场景梳理


基于CMDB的AI全流程自动化故障处理闭环



变更影响分析


事前分析:是否可以发布

事后分析:影响了哪些系统



根因分析



告警影响分析



告警关联分析



日志分析



故障应急推荐


灵感分享之三:打通运维体系工具


从「人找工具」到「工具找人」的跃迁


随时提问,感知当前上下文,扭转运维模式,实现从“人找工具”到“工具找人”的转变。



平台能力AI化



任务分拆及调度



低代码AI助手


灵感分享之四:AI Center


智能体建设:AI的灵魂工程



AI Center对话场景



11

Murphy产品核心功能界面展示(局部):


Murphy能力场景局部之一:智能体建设



Murphy能力场景局部之二:运维编程助手



Murphy能力场景局部之三:基于NLP人机交互(如CMDB、监控)



12

优维Murphy:

惊艳现在,预设未来


Murphy的诞生,是优维团队借用AI赋能运维的一次成功落地,在小心求证的进程中,很多曾经的大胆假设得到了正确论证,同时也收获了很多意想不到的全新惊喜。

正如始终相信“美好的事情即将发生”,我们始终相信“AI的美好未来是大模型AGI”,大模型催化垂直行业的形态剧变只是时间问题。

Murphy终将成为你我身边的运维助手,作为运维行业的从业者,去拥抱和探索它是我们的浪漫宿命,因为它的智能进化前景不可估量。敬请广大客户和我们一起期待Murphy的无限可能。


彩蛋一:Murphy现已加入【开放平台】能力套餐并对客户开放

彩蛋二:点击【阅读原文】提交预约申请,我们将抽取十位客户提供预约展示(远程或本地)注:报名截至5月7日23:59,预约从速!