网络通信 频道

告别“亚健康” 5招提升网络可用性

  【IT168专稿】您的网络健康么?您的网络足够健康么?人们常常需要体检,那么,我们的企业网络是否已处于了“亚健康”状态?拿什么衡量和提升我们的网络性能呢?今天我们就一起探讨一下企业网络最新的提升性能设计和方案。

  可用性是衡量网络服务的重要指标之一,可用性是指一段时间内,系统正常工作时间占总时间的比率。

  网络可用性指标的用途有:

  业务部门可以明确了解网络对服务的支持水平。

  网络设计人员可以了解设计目标,采取相应的技术和产品达到此目标。

  运维人员可以了解对运维的需求,提供相应保障力度。

  最终用户可以了解自己所得到的服务水平。

  现在有的企业已经有明确的网络可用性衡量考核目标,而那些没有明确的衡量指标的企业对网络可用性也是十分关注,因此,需要建立网络可用性衡量机制以明确可用性的度量。

  网络可用性主要涉及到两个问题,一是如何提升网络可用性,二是如何衡量网络可用性。

  再好的管理,我们也不能做到绝对的避免网络事故的发生,但是事故是由一些潜在的风险和隐患造成的,在设计和运维的过程中可以及时发现和规避风险,最大程度上避免事故的发生。总的上说,可以从网络组件、网络架构、网络协议与配置、网络运维、网络基础支撑这五个方面来考虑提升网络的可用性。

  基于网络组件上的考虑

  引入组件生命周期管理,保障重要设备,部件都能及时得到支持和服务。在网络关键部位使用那些已经停止支持、即将下市、得不到维修保护、无法更新的产品对网络的可用性非常不利。

  对功能相同的网络组件进行标准化,尽量统一到近似或一致的软、硬件版本,以便维护管理。

  产品生命周期图如下

  基于网络架构上的考虑

  不同用户在网络架构规划维护上存在很大差别:没有仔细规划过的网络随着网络发展会有较多难以处理的历史问题;经过仔细规划但在维护过程中一些原则被打破、设计特性被修改的网络,它们的原规划会变的模糊不清;经过较好规划,而且及时修正规划、调整网络、定期审核规划与现状差距的网络则有很好的可用性。

  因此建议定期组织各方面的专业人士对网络架构进行审核修订。具体内容涉及:业务部门的业务变化和可能的反馈、设计人员的架构变化、运维人员在运维过程中的常见问题和运维痛点、外部专家对技术风险和发展趋势的评估预测。

  基于协议配置上的考虑

  具体的协议、配置优劣对可用性有显著的影响,快速收敛,协议参数调优等有助于提高冗余部件间的切换时间,对提高可用性有较大意义。因此建议建立统一的配置模板,并针对路由收敛、冗余协议等进行优化。例如可在整个的运维过程中将端口下的配置、说明、log、网管上的配置建立一个统一的标准和优化机能。

  基于运维上的考虑

  供应商服务管理。包括厂商需提供适合的备件服务水平和电信公司对线路服务质量的监控。

  完善基本的监控体系与管理流程。包括:基本的网络监控与事故管理、问题管理、变更管理;基于业务的事故定级、问题根源分析、变更与回退计划;软、硬件版本管理、生命周期管理;远程设备的带宽访问。

  重要变更、上线前的测试,需搭建好相应的测试环境。

  检查配置是否符合规定。

  重大事故的快速响应演练。包括跟用户交流,快速的联系到后台的支持厂商,做好利益相关方的沟通。

  定期的网络架构评估与优化。

  基于基础设施支撑上的考虑

  从实际中看,由基础支撑引起的网络问题占显著的部分。具体的基础设施支撑要考虑到:1.电源,包括供电能力,UPS,电源冗余与网络冗余的配合。2.空调方面的粉尘情况和温度监控。3.布线上的走线空间,标签处理。4.电信接入上需处理好多供应商分别接入情况。5.其他方面,如防雷击,静电防护等。

  如何衡量网络可用性

  通常涉及到两方面的考虑。一个是设计时的考虑:对关键路径可用性值的理论估算。另一个是运维中的考虑:从用户的角度,对实际服务可用性的测量。

  关键路径可用性值的理论估算

  估算时采用 元件可用性→组件可用性→系统可用性 的估算进程。如下图:

  其中元件可用性包括元件的平均持续工作时间(MBTF)和维护水平(MTTR),组件可用性在元件可用性和组件构成关系上构成,系统可用性则在组件可用性和可用性连接关系上构成。

  下图为关键路径理论可用性计算示例。由实际的网络连接图简化成可用性逻辑关系图,将具体设备的可用性值代入可用性逻辑关系图可计算出关键路径可用性。图中列出了组件串、并联时可用性计算公式。

  服务可用性的实际测量

  实际运维中往往从最终用户的角度测量服务可用性,根据网络提供的不同服务,建立不同的可用性模型,而实测的原始数据往往还需要根据故障发生时间、用户是否得到通知等进行修正。

运维中对可用性测量举例
0
相关文章