网络通信 频道

王怀志:有效监控系统,发现瓶颈关键点

  【IT168 架构师大会】网络监控一直是IT运维中的一大难点,这不仅是因为监控话题比较敏感,更是因为其技术和架构一向是不被人所熟悉,那么用什么办法可以有效监控网络了?海纳互联网研究中心主任技术总监王怀志先生就在2009系统架构师大会上带来了精彩的演讲。


海纳互联网研究中心主任技术总监王怀志

  优化是长期的系统工程,需要不断的完善

  “监控最主要的是监测公司整体网络情况,针对公司现有网络进行不断的调优。从而使得公司网络可以优化到非常好的状态。而优化本身,就是一个长期的系统工程,需要在现实环境中不断去完善。”王怀志开门见山谈到为什么要做监控系统。每个企业都要经历开发,运营,优化,开发这么一个循环过程,其中优化就是其中重要的一个环节。在谈到影响系统优化的因素,王怀志解释道:“业务的变化;流量的变化;平台的发展是构成系统优化的三大因素”而对着三大因素优化的结果即为系统模块的调整/重构以及系统架构的调整/重构。而且从现实情况来看:系统优化的可能性远远大于增加设备的可能性。 

  瓶颈监控 脱离传统抓住重点

  传统的运维监控并不能很好的了解到系统运行的状态,就比如分析网络流量,通常得出结论:系统负载太高或者干脆得不出结论。分析Cpu和内存,就有可能告诉研发人员有问题,但不能告诉到底是什么问题。分析图表和数据,虽然有效,但是依赖与研发人员的技术经验和工作态度,从另一方面来说也是加大了分析风险。

  相对来讲,运维监控需要改良和提高意识和手段,采取瓶颈监控的办法是对运维监控的有益补充,其为专门为了系统优化和瓶颈定位的监控。

  瓶颈监控好处:相对准确的定位问题,缩短优化周期,降低研发风险,提高工作效率。

  瓶颈监控特点:深入系统内部进行监控统计,根据已知的问题来判断。

  而瓶颈监控的思想就是不断的分析与研究,在积累经验的基础上提高对系统重点的分析能力。

 

  设计开发高负载高并发系统原则有以下几点

  ·保证数据存储的连续性,而不是跳跃性,尽量一次IO解决问题
  ·保证线程锁尽可能少
  ·尽可能异步代替同步
  ·避免用户引发计算,所有的计算结果尽可能提前生成
  ·靠算法优化,而不是加大内存和增加cache解决负载问题

  瓶颈监控基本方法

  在谈到瓶颈监控的基本方法,王怀志与我们分享了他长期实践当中总结出来的要点。


监控用户触发请求的成功率
 

监控随着数据量增长,单个请求的响应时间

 
监控分布式系统的单点线程并发数

 
监控分布式系统的点与点之间的报文请求成功率

  最后,在谈到瓶颈监控对整体系统的益处,王怀志强调瓶颈监控是对运维监控的补充和有目的的细化;是依赖自己公司的历史经验和特定系统的设计原则;瓶颈监控降低了研发风险,提供科学的决策数据;建立公司自己的瓶颈监控系统,有助于研发经验的积累。

  “瓶颈监控是一种思维方法,需要一个不断积累知识,不断完善知识的过程,最后形成公司自有的独特的系统优化和瓶颈定位的知识库。”

0
相关文章