【IT168评论】IT和NetOps团队花费了大量的时间来规划、部署、升级、维护、排除故障和监控网络。这需要对整个网络环境有一个完整的了解,包括本地的、云的或混合环境的。但是,随着网络继续变得越来越复杂,团队很难跟上步伐。AIOps是一项旨在帮助自动化和增强IT操作的技术。根据Gartner的说法,“AIOps结合了大数据和机器学习来自动化IT操作流程,包括事件关联、异常检测和因果关系确定。”
AIOps的基本前提很简单。
1)它可以在所有的数据源中进行分析,以确定模式和相关性;
2)它可以提供前瞻性的见解;
3)它可以使IT部门在问题发生时或发生前自动处理或解决。最近的研究表明,技术人员不太可能相信这种技术。事实上,根据EMA的一份报告,他们更倾向于相信自己作为网络基础设施专业人员的技能能力,而不是相信一套算法的优点。
报告显示,有实践经验的个人更有可能相信AIOps可以提供的生产力和效率效益。但是,给技术人员提供他们所需的第一手AIOps经验水平,并不总是能够在前期实现。
AIOps使用案例
那么,如何才能克服这些AIOps的偏见和误解,让你的团队了解这项技术的巨大潜力?让我们来看看五个关键的用例,它们应该能帮助技术人员清楚地看到其好处。
1)AIOps可以通过为企业提供异常检测、自动安全事件修复、智能警报/升级和自动服务问题修复等技术来简化网络运营工作流程,当把该技术应用到网络管理中时,AIOps会对网络安全(防火墙、IDS/IPS、设备剖析等)、数据中心网络(第2、3层交换、虚拟覆盖和公共云网络如laaS)产生巨大的影响。 AIOps平台的主要优势是自我学习的能力,能够理解正常和非正常的网络和应用行为,然后对异常情况发出警报,从根本上改善了网络运营和相应的工作流程。
让我们以设置不良应用体验的阈值为例。由于应用体验取决于多种因素,包括源和目的地之间的物理距离、最后一英里的网络带宽、终端用户设备的资源配置等等,因此整个网络中不同应用的基线是相对不同的。为企业级网络手动应用阈值既具有挑战性,又不切实际。使用利用历史数据的基线技术,可以确定上下文基线以及相应的动态阈值,随着时间的推移,这些阈值可以根据网络的状态而改变。这种调整阈值的能力,从而产生有意义的警报,是改善网络运营工作流程的一个可靠的方法。
2)AIOps解决方案可以减少费力的故障排除,因为网络专业人员无需花时间浏览数据,就可以找到网络流问题和安全事件的答案。在使用AIOps时,你可以应用先进的机器学习(ML)和基于人工智能(AI)的分析方法,使你的IT团队通常管理的各种任务自动化。ML驱动的AIOps已经大大改善了威胁检测,从而改善了安全事件响应方法。这在威胁检测方面尤其如此,如网络钓鱼攻击。通过了解客户端到服务器和服务器到客户端的互动模式、发送和接收的字节以及它们之间的时间间隔,基于ML/AI的技术可以非常准确地识别此类攻击。如果只是看源头的状态,这些实际上是不可能检测到的。
3)AIOps通过将工具整合到一起来提高生产力。大多数NetOps团队使用4到10个工具来管理网络需求和解决可见性问题。让AIOps解决方案为你的团队自动进行数据审查和管理协议,可以提高生产力。AIOps平台通常会做得更好,因为有更多类型的网络遥测数据可用--如通过设备、链接、拓扑状态的网络基础设施健康状况;通过应用可见性的应用健康状况;通过相应策略、用户信息、位置信息、应用托管区域的服务质量等等。
通过吸收来自多个来源的信息,并查看这些数据集之间更深层次的相关性,可以挖掘出特定行为的根本原因。例如,一个典型的应用性能(较低的MOS分数)可能是由于拥堵的链接导致的丢包、DOS攻击导致的网络设备CPU过高、配置不好的QoS策略、或不正确的路由,从而导致服务器和客户端之间的路径更长。通常情况下,网络管理工具看的是这些遥测来源的一个子集,因此能够提供一个不完整的画面。然而,如果一个AIOps平台能够摄取、处理、关联并推导出这些不同的数据集,就会出现一个更完整和准确的根本原因的画面。
4)AIOps允许团队专注于战略业务驱动计划,如容量规划或通过业务应用程序使用消费者应用程序。根据EMA的报告,90%的参与者同意AIOps可以为他们的企业带来更好的业务成果。这种好处可以直接通过更好地了解现有或历史趋势以及预测它们的未来,或者仅仅是因为IT人员可以专注于业务专家,而不是被动地排除网络和应用问题。前者的一个例子是,在零售环境中,对用户行为与应用程序使用的更多理解或映射。如果商店WiFi网络中的店内移动应用流量与某类产品的需求(通过基于URL的识别或类似技术)之间有很强的相关性,零售商可以广泛提供搜索到的商品,或将其放在一个方便的地方,使其容易到达。使用模式也可以提供关于可能增加可用Wi-Fi带宽(或不增加)的见解,以优化业务目标。
5) AIOps帮助实现自动化操作。理想情况下,AIOps以ML和AI的形式应用高级分析,使IT和NetOps团队已经处理的操作自动化,如改变防火墙规则,将一个来源列入黑名单,推送网络QoS策略变化,以改善VoIP的带宽分配,或推送策略变化,通过SD-WAN环境中的互联网链接为非业务流量路由应用程序流量。这就为您的团队创造了一幅在一个正常的网络中被认为是 "正常 "的画面,因此,有助于准确地识别他们需要调查和解决的任何异常情况。有了这样的洞察力,NetOps团队就能在解决网络问题时快速行动。为了进一步阐述自动化(在现代控制器驱动的企业网络中),AIOps平台可以通过直接与部署的网络控制器集成,并通过控制器的API推送配置变化,为潜在问题提供补救。这简化和精简了自动化的范围、合规性和安全考虑。
写在最后
AIOps在简化工作流程和提高IT和NetOps团队的生产力方面有很大潜力。这可以改善业务成果,并允许将资源重新分配给其他项目。 不幸的是,即使有上述明显的好处,该技术要达到采用的成熟度仍有很长的路要走。EMA报告称,目前只有38%的企业为AIOps编制预算,而且大多数人预计在2022年之前不会有可用的预算用于此。随着越来越多的企业开始全面实施AIOps,以及更广泛的行业对AIOps的好处有了更多的了解和认识,AIOps应该开始在企业IT优先事项的长列表中上升。