网络通信 频道

路由操作系统编程:缩短网络故障停机时间

  不同于以往,现在的网络不仅需要支持业务,而且还必须驱动业务。如果网络故障中断,业务也将被迫中断运行。故障中断将造成工作效率下降和收入损失等后果。

  网络停机的原因可能是产品故障、服务问题或计划内维修等活动。但是,导致50%以上网络停机事故发生的唯一单方原因却是人为错误。遗憾的是,企业常忽视这个因素的存在,而去一味地关注硬件、链路或软件故障。

  据FCC委托网络可靠性执行委员会在2007年开展的网络停机调查显示,近一半(49%)的重大网络事故都是由程序错误引起的,找出这些错误即可迅速解决问题。而Yankee Group早期开展的调查显示,62%的企业网络停机事故的罪魁祸首是人为错误。

  小错误酿成严重后果

  大多数人为错误都发生在路由器或其他网络产品的配置过程中。即便是最老练的工程师也知道键盘输入错误在所难免,并由此导致出现语法错误或者配置好的新产品无法实现预期成效:防火墙被安装在错误的接口上、连接主站点的链路中断、过滤清单中出现了错误的IP地址。即便是最微小的错误也将导致整个系统中断运行,而在当前的商业环境中,无论是在运行效率还是在客户信任度方面,故障中断都将给企业带来灭顶之灾。

  当业务连续性遭到威胁时,企业迫切需要通过新方法来加速解决网络问题,最好能够采取适当措施来防止发生错误。具体来说,网络经理需要访问自动配置,并要求网络产品具备分类监测和诊断能力,以便在接到错误报告时能够即刻获取解决问题所需的信息。


  通过JUNOS软件提高网络可用性

  作为Juniper 网络公司强韧的网络操作系统,JUNOS能为解决上述问题提供极具吸引力的解决方案。JUNOS能够检查有效配置并对配置实施定制的法规遵从检查。当系统发生错误事件时,产品可通过自动的、可定制的诊断和故障排除功能来缩短中断持续时间。从设计伊始,JUNOS工程师就寻求通过更好的方法来设计并自动实施运行步骤、接口和工具,以便提高服务质量和运行效率。例如,JUNOS CLI包括多个特性(如承诺、确认和回退)用于避免激活并隔离存在缺陷的配置,以防无意中导致网络停机。

  定制脚本的强大能力

  JUNOS用于实现运行自动化的近期创新包括了运行在产品中的灵活的脚本定制技术。通过JUNOScript Automation脚本自动编制功能,企业可将资深工程师的专业技能扩展到所有的运行人员,并避免重复发生运行错误。原因何在?这个工具能够提取并验证配置信息,同时自动实施事件检测和诊断程序,例如:根据承诺编制脚本解析配置,并通过宏来扩展提取后的配置、生成警报、拒绝请求或修改配置等。这些脚本均由IT部门的工程师定制设计,能够增强企业对全球标准的遵从能力以及满足每个网络特定要求的能力,从而大幅度减少配置错误。

  运行(op)脚本和事件策略允许网络工程师创建定制脚本,用于网络监控和数据关联、事件驱动的变化检测、按顺序自动故障排除、提供修复指导甚至是特定的修复包。例如,一个脚本可定期检查CPU利用率过高等网络警报参数,以便主动通知主要负责人加速识别和解决问题。

  网络运行中断是能够避免的威胁
  这些灵活的脚本编制技术提供了配置验证、定制故障排除以及自动响应能力,以避免发生连带的重大问题并帮助快速恢复正常运行,从而提高网络运行效率。随着不断诊断出网络停机问题并为它们编制脚本,将能够缩短下次中断的持续时间,提高持续运行能力。
  这些工具和特性能够直接降低人为错误对网络可用性的影响并进一步完善JUNOS的系统稳定性特性--模块化软件设计、受保护的系统资源、根据严格的开发程序使用单一源码库构建单一版本模式的软件等。

  这些全新的JUNOS工具对网络故障中断影响如何?随着脚本库不断壮大并且在企业内部和企业之间共享,网络性能将得到大幅度提高。此外,Lake Partners Strategy Consultants近期开展的调查也对JUNOS在缩短网络故障中断的潜力方面提供了一些见解。

  JUNOS恪守严格的开发原则

  计划内的软硬件升级占所有网络故障停机的30%以上。因此,最大限度地缩短升级时间和减少升级故障对于降低运行成本和缩短计划内维护时间至关重要。对于现有系统,公司常发现需要频繁升级产品来添加新特性。然而,这些升级常会带来新问题,迫使公司不得不实施降级,然后等到修复包面市后再实施升级。升级-降级-再升级的循环往复迫使运行团队切换使用不断变化的、复杂的系列软件版本,从而延长了网络故障中断时间。

  相比之下,JUNOS软件采用单一版本模式,每年按计划定期推出四个版本。每个新版本都是上个版本的超集,并且在面市前必须通过回退测试以确保不存在严重错误,从而确保新版本可以提供上个版本中的全部功能。客户只需选择并验证一个版本即可针对所有的JUNOS平台完成一次升级。

  调查揭示JUNOS软件的价值

  2007年初,Lake Partners采访了122名客户,以便了解他们在网络中部署了哪些产品、正在使用哪些操作系统以及具体的网络运行状况。结果显示,虽然路由器维护占用了一大块的网络运行时间,但各公司在具体时间上却存在较大差异,取决于操作系统。

  具体说,监控网络状态和产品参数平均占用20%的运行时间。而运行JUNOS软件的客户报告说,与运行其他软件的产品相比,监控JUNOS产品的平均时间缩短了24%。随着客户不断开发强韧的运行脚本库来自动执行监控任务,他们将能够进一步缩短监控活动时间。

  降低意外事故的发生率

  在Lake Partners调查中,使用JUNOS软件的客户还报告说他们已将意外事故的平均发生率降低了24%。此外,这些事故的平均持续时间也比运行其他软件的产品低30%。面向配置变化和轻松回退到此前配置的Commit流程是实现上述优势的主要原因。

  Commit脚本能够基于网络策略验证配置变化,并且将一系列重要输入持续扩展到多个产品上的复杂的配置命令中,这将大幅度减少因人为错误造成的意外事故的数量。

  缩短故障排除时间

  另据参加Lake Partners调查的客户称,故障排除平均占到总运行时间的21%。JUNOS软件的一致性和模块性能够将故障排除的平均时间缩短30%。早期报警脚本和针对已知事件的自动响应机制 (如CPU使用量激增或VPN故障)将帮助客户进一步缩短故障排除时间。

  Juniper的优势
  JUNOS软件的优势在于:
  " 通过持续运行的系统来提高网络的SLA性能。
  " 防止人为错误、提供主动通知和其他自动化优势,从而提高运行效率
  " 提高灵活性,以便提供新服务并满足全新业务寻求
  " 降低总体成本并增强投资保护

0
相关文章