基于网络组件上的考虑
引入组件生命周期管理,保障重要设备,部件都能及时得到支持和服务。在网络关键部位使用那些已经停止支持、即将下市、得不到维修保护、无法更新的产品对网络的可用性非常不利。
对功能相同的网络组件进行标准化,尽量统一到近似或一致的软、硬件版本,以便维护管理。
产品生命周期图如下
基于网络架构上的考虑
不同用户在网络架构规划维护上存在很大差别:没有仔细规划过的网络随着网络发展会有较多难以处理的历史问题;经过仔细规划但在维护过程中一些原则被打破、设计特性被修改的网络,它们的原规划会变的模糊不清;经过较好规划,而且及时修正规划、调整网络、定期审核规划与现状差距的网络则有很好的可用性。
因此建议定期组织各方面的专业人士对网络架构进行审核修订。具体内容涉及:业务部门的业务变化和可能的反馈、设计人员的架构变化、运维人员在运维过程中的常见问题和运维痛点、外部专家对技术风险和发展趋势的评估预测。
基于协议配置上的考虑
具体的协议、配置优劣对可用性有显著的影响,快速收敛,协议参数调优等有助于提高冗余部件间的切换时间,对提高可用性有较大意义。因此建议建立统一的配置模板,并针对路由收敛、冗余协议等进行优化。例如可在整个的运维过程中将端口下的配置、说明、log、网管上的配置建立一个统一的标准和优化机能。
基于运维上的考虑
供应商服务管理。包括厂商需提供适合的备件服务水平和电信公司对线路服务质量的监控。
完善基本的监控体系与管理流程。包括:基本的网络监控与事故管理、问题管理、变更管理;基于业务的事故定级、问题根源分析、变更与回退计划;软、硬件版本管理、生命周期管理;远程设备的带宽访问。
重要变更、上线前的测试,需搭建好相应的测试环境。
检查配置是否符合规定。
重大事故的快速响应演练。包括跟用户交流,快速的联系到后台的支持厂商,做好利益相关方的沟通。
定期的网络架构评估与优化。
基于基础设施支撑上的考虑
从实际中看,由基础支撑引起的网络问题占显著的部分。具体的基础设施支撑要考虑到:1.电源,包括供电能力,UPS,电源冗余与网络冗余的配合。2.空调方面的粉尘情况和温度监控。3.布线上的走线空间,标签处理。4.电信接入上需处理好多供应商分别接入情况。5.其他方面,如防雷击,静电防护等。