网络通信 频道

统一网络流量管理技术实现

  一、 困扰网络性能的问题

  随着网络带宽增加与各种不同网络应用程序的使用,企业对网络管理也越来越重视。一般来说,根据网络建置的顺序,网管分为四个阶段:

 
 
   第一阶段为网元管理(Element Management):企业建置网络时,首先会面对构成网络基本设备,这些设备包括了计算机、路由器、交换机等;在这阶段所进行管理工作包括网络设备的安装、设定与维护,利用一台中央服务器来管理企业内分散之计算机、路由器与交换机,主要目的为让使用者能使用网络上资源,这也是网管最基本的要求;如:CiscoWorks就是常用的设备管理系统。

  第二阶段为运行管理(Operations Management):运行管理包括了拓朴管理、资产管理、故障管理、事件管理、除错与告警等,主要目的是让网络能够正常运作,当有问题发生时能通知相关人员来解决,此一阶段主要管理设备各界面是否正常运作,当有故障发生时,系统可以立即发出报警;另外,运行管理也包括了对异常流量之告警与提供除错的工具,如实时监控与协议分析等;此类代表性系统如HP OpenView、IBM Tivoli等。

  第三阶段为性能/服务管理(Performance/Service Management):当网络建置完成并顺利运作后,就进入性能与服务管理阶段,性能管理涵盖了网络分析监控、应用分析监控、带宽规划、故障排除、错误管理与服务等级管理等,其目的在于维持网络传输之品质与网络应用系统与服务能运行顺畅,除了显示实时流量信息外,还进行长时间之流量收集、分析与统计,提供管理人员带宽规划与趋势分析报告,并可以针对不同应用系统与服务之响应时间进行监测与统计,提供服务等级管理。

  第四阶段为业务管理(Business Management):业务管理包括了业务服务、业务影响分析、应用仿真测试等。此一阶段代表了企业在实施新的业务时,如何预先从不同层面去分析新业务上线后对现有网络环境所造成的影响与所带来之效益;

  目前在企业管理网络时普遍遇到以下问题:

  1、网络可视性:

  知道网络的利用率,但不知道是什么应用程序在网络上运行?主要用户有哪些?

  对于日趋重要的多媒体应用,如VoIP、视频会议等进行有效的监控和管理,以确保服务等级;

  遭遇到由于病毒或黑客引起的流量暴涨而导致网络严重拥塞;

  网络带宽规划没有长期统计数据来预测其网络使用趋势;

 网络需要优化,但是需要提出具体的统计资料来支持相关决策;

  2、应用性能:

  当用户抱怨应用性能降低时,到底是服务器负载太高而处理慢呢?还是网络拥塞传输慢呢?

   如何维持企业内重要应用与服务的性能呢?

  无法提供详细之网络管理报表,包括各局域网与广域网之流量分析与应用服务器之性能状况;如:IP地址、应用层响应时间及协议分布等;

  3、故障排除与错误管理:

  每天都有新的病毒出现,要如何在病毒肆虐前发现中毒征兆呢?

  业务网,办公网或Internet带宽被个别用户占用,如何找出凶手呢?

  网络出现异常流量时,如何找出原因并解决问题呢?

  解决这些问题的根本在于有没有一个好的性能管理工具可以利用,这也是建置性能管理系统的开始。所谓的工欲善其事,必先利其器,有效的性能管理系统可以帮助网络管理人员更了解企业内部网络之运行状况,也能加强故障的管理及排障能力。

  谈了这么多性能管理之优点与实行的需要,那么性能管理究竟包括了哪些范围呢?首先我们就性能管理之资料来源来看,与设备管理与运行管理不同的是,性能管理之资料来源主要来自网络流量,这些流量可能来自内部网络(Intranet)或是广域网(Internet),最普遍的收集流量的方法为放置探针(Probe)来监控网络,探针是一个硬件收集器,利用不同界面架设在内部网络或广域网上,以旁路分接方式利用Y形缆线或是Tap,将流量复制到探针中进行译码、分析与统计,另外也可利用交换机镜像功能将流量复制到探针。探针将流量归纳为下列七大类资料:

  1. 统计(Statistic):包括网络利用率与吞吐量、协议分布、包大小、广播包比例;

  2. 主机(Host):网络层与应用层主机IP地址列表;

  3. 通信对(Conversations):网络层与应用层通信对列表;

  4. 告警(Alarm):针对各种异常现象之自动报警;

  5. 响应时延(Response Time):应用程序及服务响应时延;

  6. 误码(Errors):误码种类、错误率;

  7. 数据包档案(Trace):原始数据包资料;

  这七大类资料代表性能管理资料核心,可以帮助网络管理人员分析并管理企业网络相关之性能问题,例如统计出网络应用分布与主要使用者;发生异常流量时立即收到告警,并找到问题来源与祸首;当重要业务的性能下降时,也能藉由响应时延统计找到哪个服务器与客户端发生问题,并判断是因为网络或是服务器所造成;或是利用数据包译码来分析原始数据包资料,排除网络故障。

0
相关文章