ASON技术在传统的传输网络中引入了控制层面,实现了节点、连接的自动发现,实现了连接的自动建立,实现了多点故障的保护恢复和多种保护恢复机制的选择。 这种智能性给传统网络的运维带来了不小的变化,传统传输网络管理和运维的很多工作都需要人工参与,而ASON网络中大多数工作是自动完成的,这种变化不仅仅是简单的人工到自动,而是理念上的变化。<
BR>
传统传输网络的运维和管理
网络的运维和管理主要包括以下工作:电路调度、告警分析、故障管理、性能分析、资源管理、数据处理、网络优化等。在以分层方式实现运维和管理的传输网络中,这些工作大多都是靠工作人员来完成的。
网管人员进行电路调度时,在知道所需的电路的源和目的地址以及所需带宽的情况下,需要查看网络的可达路由中哪些是空闲的,然后依据流量均衡、最少跳数,最小代价或者其它约束条件从这些空闲的路由中选择一条路由进行配置。具体配置过程中,还要依据所需带宽,选择合适的时隙沿路由对经过的节点进行交叉连接配置。如果在一个环中无法配置所需电路时,则需要跨环进行配置,这样路由的选择和交叉连接的配置就更为复杂,需要的时间也更长。如从北京到上海需要配置一条2M的电路,查找到的路由为北京-武汉-上海,而该电路需要在两纤双向复用段保护环中(速率为10G)配置,为了说明配置过程,我们以武汉节点为例来说明,为配置该电路,必须指定2M的入时隙和出时隙,而确定入/出的2M时隙必须了解该2M在所属155M中的位置(155M中包括63个2M),还必须指定该155M在10G中的位置(10G包括64个155M),这样,指定了2M在入/出节点中第几个155M的第几时隙就可以进行交叉连接配置。由此可见,当电路经过的节点数比较多时,配置是非常复杂和耗时的,而且也不利于统一规划和网络的优化。
告警分析和故障的管理,在传统的传输网络的告警分析中,主要依赖厂家网管系统中提供的简单的告警处理,而故障的定位和管理根本就没有。这在纯SDH系统中,问题还不是太大,但在SDH+WDM系统中,由于底层故障不仅反映到自身系统中,还反映到上层多个相关联的系统中,没有故障定位就会导致多层保护倒换无法协调,而且给故障的人工处理也带来一定的难度。总之,告警分析简单、缺乏故障处理能力给网络管理和运维带来的问题比较大,因为故障情况下,受影响的业务都需要得到实时或者准实时的解决,这就需要故障的快速定位和处理。这也是大多数运营商非常关注故障定位的原因。
网络优化和资源管理:网络的优化一般是在两种情况下进行的,一是资源分配不合理或者不够用;二是提高网络的其它指针(如运维考核指针、网络安全性指针等)。传统的传输网络为环形网络,所以如果在一个环中配置路由时,可选择的路由只有两条,一般情况下,选择的路由都是跳数最少的路由,这样可以节约板卡资源。而由于业务发展的不均衡性,这样选路的结果就会导致环网中局部资源利用率过高,而其它部分利用率过低的现象,这种现象在节点数较多的环形网络中更为常见,所以为了优化网络使用的资源,需要调整电路,使资源得以合理利用。可想而知,这在业务已经配置好,而且调度需要完全手动的情况下是多么复杂,而且在线业务的手动重新配置的风险也比较大,由此导致的结果就是仅仅进行局部的优化,而是不断的升级扩容或者大环拆小环的工作。此外,运行维护的指针有时候和资源优化的目标是相互矛盾的,安全性指针是网络中最重要的指针,而为了保证某些重要电路的安全性,使其具有抗双点故障的性能,或者避免出现双点故障情况下出现某些局向全阻的现象,某两点之间的电路(某个局向的电路)就应该分配到不相关的,而且不在同一个环上的两条或者多条路由上,因为不在同一个环上的两条路由,必定有一条不是最优的,而且有可能代价很大,这样势必造成网络资源的浪费,所以这种调整往往是在出现故障已经影响到重要的业务,或者是在预测到单个环上故障概率很高的时候的一种预防措施,譬如说飓风、洪水等自然灾害的影响。
性能分析和数据处理:这是日常维护和管理工作不可缺少的一部分,从大量的表格中取出有用的资料来进行分析和处理,然后分析出电路利用率、信道组织图,故障概率表,资源利用率等,按星期、按月和按季都要出这样的分析报表,此外,为了分析的方便,还经常需要当年和往年同期比较的资料分析,在传统的运维中,这部分工作都需要人工来做,工作量大,而且容易出错。
ASON网络的运维和管理
相比传统传输网络的运维和管理大部分靠人工完成,ASON网络的运维和管理则主要是自动完成的。
ASON网络中的电路调度是非常容易的,只需知道源和目的地址、带宽需求、保护倒换等级,并指定选路的具体目标(如代价最小、跳数最少),控制平面就会按照要求自动选择一条满足条件的最优路由。某些特殊的情况下需要指定是否必须经过哪些节点/链路或者必须不经过哪些节点/链路,是否需要业务均衡,还有是否要求SRLG(共享风险链路组)不相关等一些约束条件。
ASON网络中对告警做了专门的处理和分析,可以实现故障的自动定位,这种定位包括两个层次,一是硬件故障,二是线路故障。正因为有了故障的立即寻址功能,ASON网络才可以支持线路保护和业务保护共存,支持多粒度、多层次的网络保护。目前,基于SDH的ASON的故障定位功能已经初步实现,基于OTN的ASON的故障定位功能比较复杂,因为其定位涉及到纯光层告警的处理和分析。
ASON具有丰富的性能分析和强大的数据处理功能。可以很方便地给出资源利用率的统计和分析、信道组织图统计,还可以给出网络故障分析,即分析网络中单点故障情况下,网络的受损情况,逐个点遍历,以此得出哪个点的重要性最高;同样可以对任意两点进行遍历,进而提供单点故障情况下,应该重点保护哪些区段。同理,也可以对多区段故障进行分析。此外,可以提供链路资源利用率的比较、业务路径显示,还可以选择对某链路或者某个节点的资源占用情况单独分析和处理,并且给出升级扩容的建议。
网络优化规划工具是ASON相比传统传输网络所独有的一个部分,也是相对独立的一个部分。网络优化规划的功能很多,可以用作初期的网络规划,对提出的网络方案做技术经济的可行性分析,并对影响因素做灵敏度分析,得出对CAPEX和OPEX影响最大的因素,对其做特殊重点的考虑。可以用作资源的优化,对使用不合理的资源进行重路由,以使得全网的资源利用趋于合理,还可以进行碎片整理,节约网络资源。优化规划工作一般是离线进行的,但是它有和现网的接口,可以在线把现网上的数据采集过来进行分析和处理,利用这些资料来对现网进行优化分析,并把优化后的数据逐条下载到网管上,动态实现对网络优化的管理。优化规划的目标很多,包括提高网络生存性、提高资源利用率、降低投资、提高投资收益比等,具体优化可以按照单目标进行,也可以按照多目标的方式进行,常用的应该是多目标优化,即把最重要的目标作为优化目标,其它目标作为约束条件来进行综合的优化和规划。
此外,业务管理也是ASON独有的一个部分,因为ASON网络中可以引入一些新的业务,如OVPN、BoD、组播和带SLA的服务,这就需要对这些业务进行管理和维护,这不仅需要安全性的设置,还需要依据需求随时给客户调整服务等级和带宽,这些调整是在线进行的,不会对业务造成损伤。
运维变化带来的好处和问题
不难比较,传统网络的运维和管理需要大量工作人员的参与,从路由的选择到交叉连接的配置,从故障的定位到各种数据的处理,每一个环节都离不开网管和运维人员的直接参与,这无疑浪费了大量的人力,而且选路和优化规划时可能无法达到统一或者完善。但从另一方面讲,也培养了大批非常了解网络“状态”的工作人员,在出现网络故障的情况下,只要网络中有剩余资源,网管人员就可以进行故障的恢复。而ASON网络的智能性大大简化了运维和管理工作,几乎所有实际操作都由软件来完成,运维网管人员需要做的不再是实际去操作,而是熟悉和掌握网管软件的使用,特别是网管软件中各种属性参数如何设置,如SRLG、保护属性、代价等,并且要了解这些属性参数在实际算法中到底起到什么样的作用。由于无需去人工配置和计算,运维网管人员可以很轻松的进行日常维护工作,但因其了解到的仅仅是一些属性参数和一些基本的操作,如果对ASON运行原理没有较深的了解的话,就可能对智能过度依赖,而时间长了就会造成对网络不熟悉,这样在出现软件故障或者其它不可预测的重大故障导致智能保护失效的时候,就有可能无法及时采取有效措施对网络进行人工操作来进行网络的恢复。
从辩证的观点来看,正是因为传统的传输网络不具备智能性,使得网络运维和管理都需要工作人员参与,所以培养了一大批“智能”的运维和网管人员。而ASON网络的智能性容易造成运维和管理人员对智能的依赖。所以,ASON的自动化在减轻工作量的基础上给运维和管理人员也提出了新的要求,要求他们不仅仅了解如何操作ASON的网管系统,能够熟练地设置相关参数,更为重要的是了解有关路由、保护恢复等参数设置的原理,还要定时地对网络的各种资料进行统计、处理和分析,以清晰了解网络的状态;同时对ASON设备在软硬件平台的可靠性、智能的可管理性、运维和管理的功能完善性、易操作易管理性等方面提出了更高的要求,特别是对控制平面故障情况下的运维和管理提出了特殊的要求,不仅要求控制平面的故障不能影响到正常业务,还要求控制平面有一定的自愈性。
ASON的优化规划功能的使用是网管和运维人员必须认真掌握的工具,网络运行的状态以及资料的处理和分析大多都需要该优化规划工具来执行。目前,ASON优化规划工具是区分不同设备厂商产品成熟度的重要依据,也是需要在运维中不断改进和完善的重点内容。优化规划工具的成熟与否直接影响到ASON网络运维管理的好坏。
总结
ASON给网络的运维带来了革命性的变化,相比传统传输网络,它的智能性可以节约大量人力。之所以提出辩证的观点来看ASON运维和管理,不是否认ASON带来了运维和管理上的便利,而是肯定ASON带来了网络管理和运维上革命性的功绩。只要运维和网管人员能充分掌握其工作原理,一定能在这场革命中受益匪浅。
传统传输网络的运维和管理
网络的运维和管理主要包括以下工作:电路调度、告警分析、故障管理、性能分析、资源管理、数据处理、网络优化等。在以分层方式实现运维和管理的传输网络中,这些工作大多都是靠工作人员来完成的。
网管人员进行电路调度时,在知道所需的电路的源和目的地址以及所需带宽的情况下,需要查看网络的可达路由中哪些是空闲的,然后依据流量均衡、最少跳数,最小代价或者其它约束条件从这些空闲的路由中选择一条路由进行配置。具体配置过程中,还要依据所需带宽,选择合适的时隙沿路由对经过的节点进行交叉连接配置。如果在一个环中无法配置所需电路时,则需要跨环进行配置,这样路由的选择和交叉连接的配置就更为复杂,需要的时间也更长。如从北京到上海需要配置一条2M的电路,查找到的路由为北京-武汉-上海,而该电路需要在两纤双向复用段保护环中(速率为10G)配置,为了说明配置过程,我们以武汉节点为例来说明,为配置该电路,必须指定2M的入时隙和出时隙,而确定入/出的2M时隙必须了解该2M在所属155M中的位置(155M中包括63个2M),还必须指定该155M在10G中的位置(10G包括64个155M),这样,指定了2M在入/出节点中第几个155M的第几时隙就可以进行交叉连接配置。由此可见,当电路经过的节点数比较多时,配置是非常复杂和耗时的,而且也不利于统一规划和网络的优化。
告警分析和故障的管理,在传统的传输网络的告警分析中,主要依赖厂家网管系统中提供的简单的告警处理,而故障的定位和管理根本就没有。这在纯SDH系统中,问题还不是太大,但在SDH+WDM系统中,由于底层故障不仅反映到自身系统中,还反映到上层多个相关联的系统中,没有故障定位就会导致多层保护倒换无法协调,而且给故障的人工处理也带来一定的难度。总之,告警分析简单、缺乏故障处理能力给网络管理和运维带来的问题比较大,因为故障情况下,受影响的业务都需要得到实时或者准实时的解决,这就需要故障的快速定位和处理。这也是大多数运营商非常关注故障定位的原因。
网络优化和资源管理:网络的优化一般是在两种情况下进行的,一是资源分配不合理或者不够用;二是提高网络的其它指针(如运维考核指针、网络安全性指针等)。传统的传输网络为环形网络,所以如果在一个环中配置路由时,可选择的路由只有两条,一般情况下,选择的路由都是跳数最少的路由,这样可以节约板卡资源。而由于业务发展的不均衡性,这样选路的结果就会导致环网中局部资源利用率过高,而其它部分利用率过低的现象,这种现象在节点数较多的环形网络中更为常见,所以为了优化网络使用的资源,需要调整电路,使资源得以合理利用。可想而知,这在业务已经配置好,而且调度需要完全手动的情况下是多么复杂,而且在线业务的手动重新配置的风险也比较大,由此导致的结果就是仅仅进行局部的优化,而是不断的升级扩容或者大环拆小环的工作。此外,运行维护的指针有时候和资源优化的目标是相互矛盾的,安全性指针是网络中最重要的指针,而为了保证某些重要电路的安全性,使其具有抗双点故障的性能,或者避免出现双点故障情况下出现某些局向全阻的现象,某两点之间的电路(某个局向的电路)就应该分配到不相关的,而且不在同一个环上的两条或者多条路由上,因为不在同一个环上的两条路由,必定有一条不是最优的,而且有可能代价很大,这样势必造成网络资源的浪费,所以这种调整往往是在出现故障已经影响到重要的业务,或者是在预测到单个环上故障概率很高的时候的一种预防措施,譬如说飓风、洪水等自然灾害的影响。
性能分析和数据处理:这是日常维护和管理工作不可缺少的一部分,从大量的表格中取出有用的资料来进行分析和处理,然后分析出电路利用率、信道组织图,故障概率表,资源利用率等,按星期、按月和按季都要出这样的分析报表,此外,为了分析的方便,还经常需要当年和往年同期比较的资料分析,在传统的运维中,这部分工作都需要人工来做,工作量大,而且容易出错。
ASON网络的运维和管理
相比传统传输网络的运维和管理大部分靠人工完成,ASON网络的运维和管理则主要是自动完成的。
ASON网络中的电路调度是非常容易的,只需知道源和目的地址、带宽需求、保护倒换等级,并指定选路的具体目标(如代价最小、跳数最少),控制平面就会按照要求自动选择一条满足条件的最优路由。某些特殊的情况下需要指定是否必须经过哪些节点/链路或者必须不经过哪些节点/链路,是否需要业务均衡,还有是否要求SRLG(共享风险链路组)不相关等一些约束条件。
ASON网络中对告警做了专门的处理和分析,可以实现故障的自动定位,这种定位包括两个层次,一是硬件故障,二是线路故障。正因为有了故障的立即寻址功能,ASON网络才可以支持线路保护和业务保护共存,支持多粒度、多层次的网络保护。目前,基于SDH的ASON的故障定位功能已经初步实现,基于OTN的ASON的故障定位功能比较复杂,因为其定位涉及到纯光层告警的处理和分析。
ASON具有丰富的性能分析和强大的数据处理功能。可以很方便地给出资源利用率的统计和分析、信道组织图统计,还可以给出网络故障分析,即分析网络中单点故障情况下,网络的受损情况,逐个点遍历,以此得出哪个点的重要性最高;同样可以对任意两点进行遍历,进而提供单点故障情况下,应该重点保护哪些区段。同理,也可以对多区段故障进行分析。此外,可以提供链路资源利用率的比较、业务路径显示,还可以选择对某链路或者某个节点的资源占用情况单独分析和处理,并且给出升级扩容的建议。
网络优化规划工具是ASON相比传统传输网络所独有的一个部分,也是相对独立的一个部分。网络优化规划的功能很多,可以用作初期的网络规划,对提出的网络方案做技术经济的可行性分析,并对影响因素做灵敏度分析,得出对CAPEX和OPEX影响最大的因素,对其做特殊重点的考虑。可以用作资源的优化,对使用不合理的资源进行重路由,以使得全网的资源利用趋于合理,还可以进行碎片整理,节约网络资源。优化规划工作一般是离线进行的,但是它有和现网的接口,可以在线把现网上的数据采集过来进行分析和处理,利用这些资料来对现网进行优化分析,并把优化后的数据逐条下载到网管上,动态实现对网络优化的管理。优化规划的目标很多,包括提高网络生存性、提高资源利用率、降低投资、提高投资收益比等,具体优化可以按照单目标进行,也可以按照多目标的方式进行,常用的应该是多目标优化,即把最重要的目标作为优化目标,其它目标作为约束条件来进行综合的优化和规划。
此外,业务管理也是ASON独有的一个部分,因为ASON网络中可以引入一些新的业务,如OVPN、BoD、组播和带SLA的服务,这就需要对这些业务进行管理和维护,这不仅需要安全性的设置,还需要依据需求随时给客户调整服务等级和带宽,这些调整是在线进行的,不会对业务造成损伤。
运维变化带来的好处和问题
不难比较,传统网络的运维和管理需要大量工作人员的参与,从路由的选择到交叉连接的配置,从故障的定位到各种数据的处理,每一个环节都离不开网管和运维人员的直接参与,这无疑浪费了大量的人力,而且选路和优化规划时可能无法达到统一或者完善。但从另一方面讲,也培养了大批非常了解网络“状态”的工作人员,在出现网络故障的情况下,只要网络中有剩余资源,网管人员就可以进行故障的恢复。而ASON网络的智能性大大简化了运维和管理工作,几乎所有实际操作都由软件来完成,运维网管人员需要做的不再是实际去操作,而是熟悉和掌握网管软件的使用,特别是网管软件中各种属性参数如何设置,如SRLG、保护属性、代价等,并且要了解这些属性参数在实际算法中到底起到什么样的作用。由于无需去人工配置和计算,运维网管人员可以很轻松的进行日常维护工作,但因其了解到的仅仅是一些属性参数和一些基本的操作,如果对ASON运行原理没有较深的了解的话,就可能对智能过度依赖,而时间长了就会造成对网络不熟悉,这样在出现软件故障或者其它不可预测的重大故障导致智能保护失效的时候,就有可能无法及时采取有效措施对网络进行人工操作来进行网络的恢复。
从辩证的观点来看,正是因为传统的传输网络不具备智能性,使得网络运维和管理都需要工作人员参与,所以培养了一大批“智能”的运维和网管人员。而ASON网络的智能性容易造成运维和管理人员对智能的依赖。所以,ASON的自动化在减轻工作量的基础上给运维和管理人员也提出了新的要求,要求他们不仅仅了解如何操作ASON的网管系统,能够熟练地设置相关参数,更为重要的是了解有关路由、保护恢复等参数设置的原理,还要定时地对网络的各种资料进行统计、处理和分析,以清晰了解网络的状态;同时对ASON设备在软硬件平台的可靠性、智能的可管理性、运维和管理的功能完善性、易操作易管理性等方面提出了更高的要求,特别是对控制平面故障情况下的运维和管理提出了特殊的要求,不仅要求控制平面的故障不能影响到正常业务,还要求控制平面有一定的自愈性。
ASON的优化规划功能的使用是网管和运维人员必须认真掌握的工具,网络运行的状态以及资料的处理和分析大多都需要该优化规划工具来执行。目前,ASON优化规划工具是区分不同设备厂商产品成熟度的重要依据,也是需要在运维中不断改进和完善的重点内容。优化规划工具的成熟与否直接影响到ASON网络运维管理的好坏。
总结
ASON给网络的运维带来了革命性的变化,相比传统传输网络,它的智能性可以节约大量人力。之所以提出辩证的观点来看ASON运维和管理,不是否认ASON带来了运维和管理上的便利,而是肯定ASON带来了网络管理和运维上革命性的功绩。只要运维和网管人员能充分掌握其工作原理,一定能在这场革命中受益匪浅。