文章来源:Gatner(https://www.gartner.com/smarterwithgartner/how-to-get-started-with-aiops

IT运维如何将AI用于监控数据和降低停机次数。
去年,澳大利亚2个最大的超市收银系统出现过全世界范围的技术故障,这些公司不得不在故障修复前关闭超市。事实的情况是IT团队沉浸于处理越来越多和多种监按来源的数据,这样明显迟缓了问题定位和解决。

AIOps对IT运维的影响将是变革性的
“IT运营面临IT基础架构和应用程序产生的数据量快速增长的挑战,这些数据量必须被捕获、分析和处理”Gartner资深分析总监Padraig Byrne。“再加上IT运维团队经验经验在远程工作的现实,这使得保障任意时间紧急事件的处理具有挑战性。” 加快高危停服故障或其它IT运维问题的阻止、识别并解决,业务已转各AIOps。

什么是AIOps?
简单来说,AIOps是机器学习(ML)和数据科学在IT运维问题的应用。AIOps平台结合大数据和ML机制来增强或部分替换重要IT运维场景,包括可用性和性能检测、事件分析和恢复与IT服务管理和自动化。AIOps平台通过接入和分析大量、多类和加速的IT数据,以有用的方式呈现。

IT领导者对将AI应用于IT运营的承诺充满热情
Gartner预测大型企业独家使用AIOps和数字体验监控工具来监控应用和基础设施的比例将从2018年的5%上升到2023年的30%。Byrne表示,AIOps对IT运营的长期影响将是变革性的。“IT领导者对应AI应用于IT运维的承诺充满热情,但与移动大型物体一样,有必要克服惯性以提高速度。”Byrne说“好消息是AI能力在提升,每天都有更多真正的解决方案可用。”

如何启动AIOps方案
1、不能等待。现在就开始熟悉AI和ML词汇及功能,即使AIOps项目不是迫在眉睫。优先级和功能会变化,因此你可能比预期更早地需要求。
2、明智的选择初始测试用例。转型计划得益于小的开始,获取知识并从中迭代。采用相同中的方法合并AIOps以获得成功。
3、发展并证明你的熟练程度。通过演示简单的技术,为同事和领导揭开AIOps的面纱。识别技能和经验差距,制定计划来填补空缺。
4、自由实验。尽管AIOps平台通常是成本和复杂性很高的产品,但有大量开源和低成本的ML软件可供你评估AIOps和数据科学应用程序和用途。
5、俯视IT。利用现有的数据和分析资源,数据管理是AIOps的一个重要组成部分,团队通常已经很熟练。业务和统计分析是任何现代组织的关键组成部分,许多技术跨越问题领域。 6、标准化、现代化。通过采用一致的自动化体系、基础架构即代码(IaC)和不变的基础架构模式,准备你的基础架构以支持AIops实施。
7、完全采用想像。有很多变化:产品的发展、AIOps的最新技术以及你负责的基础设施和应用程序。考虑构建与购买的连续体以及每种使用的数量。

标签: none

添加新评论