用于运营的AI(或者说AIOps平台)是向下一代网络提供可见性、洞察力和自动化的智能方式。由于分布式计算、远程用户的激增以及大规模下一代网络架构中存在的大量软件抽象层,监控和保护网络现在比以往任何时候都更具挑战性。
网络专业人员无法再有效地使用手动工具来监控现代网络的性能、网络安全和其他网络管理领域。而应该使用预测性AIOps工具,这些工具梳理大量网络数据,确定正常行为并解决可能出现的问题。
理解和监控“正常”网络行为
网络运营 (NetOps) 专业人员通常会花很长时间来尝试了解流经企业网络的各种应用程序和服务的网络流量,这可能是数月甚至数年的时间。NetOps专业人员使用这些知识以及网络可观察性工具来识别流量何时偏离规范,这表明与性能或网络安全相关的异常,企业需要特别注意。
在现代网络中,这种手动基线方法存在很明显的问题。一方面,企业现在比以往任何时候都更加依赖技术。混合基础架构以更快的速度添加、删除和分发新系统,这使得NetOps团队几乎无法跟上。
其次,当经验丰富的NetOps专业人员离开企业时,他们的知识也会随之离开。新员工通过学习曲线了解正确与不正确的流量流。失去知识渊博的员工和等待新员工发展技能之间的时间差可能会使企业面临重大风险。
机器学习和人工智能在下一代网络管理中的好处在于,与人类员工不同,它们永远不会离开。AIOps平台以更快的速度学习网络流量基线行为。此外,这些平台会自动检测网络架构的添加或更改,并在很短的时间内重建网络流量基线,而这里需要的时间比使用手动流程所花费的时间短得多。
分析网络状况数据
手动操作的另一个问题是识别和修复与性能及安全相关的问题的速度。即使网络专业人员了解关键业务应用程序的流量,传统的手动工具和流程也太慢。
对技术的日益依赖以及由于网络安全威胁导致的数据被盗、丢失或中断的风险不断增加,使得网络及其支持的应用程序和系统处于不断变化的状态。网络专业人员可以从大型现代网络基础设施的各个部分提取流式网络遥测数据。但是,面对这么多需要分析的数据,人类现在需要人工智能来理解这一切。
发现问题并提供建议
由于要分析的网络健康数据量增加,性能和安全警报的数量也在增加。网络团队必须首先对这些警报进行分类和优先级排序,然后进行故障排除以找到根本原因并采取补救措施。
网络管理员通常需要几天或几周的时间来确定根本原因,并手动排除单个性能或安全警报;找到解决问题的可行方法也可能需要大量时间。这就是AIOps平台大放异彩的地方。这些工具对网络问题进行警报、分类和优先级排序,以及查明问题发生的位置并推荐解决问题的方法。
预测分析的力量
AIOps平台正在发展到可以帮助预测与性能相关的问题,并建议在问题恶化和阻碍业务运营之前解决问题的步骤。虽然关于网络团队应该使用预测分析工具的水平存在大量炒作,但在大型复杂环境中工作的决策者和网络专业人员应该密切关注AIOps。