网络通信 频道

游龙:当务之急还是提升IT基础运维实力

  对于游龙来讲,ECC(综合系统管理)作为一种综合性的IT基础运维平台产品,一直是其IT运维管理领域的主打产品,不仅伴随着游龙打开并稳固了一方市场,而且至今在IT运维管理领域仍然有着很强势的影响力。

  2009年,面对炙手可热的BSM(业务服务管理),ECC仍然作为游龙的主打产品着力在IT基础运维管理领域,并用一种平静但却富含深厚能量的状态结结实实地对抗着BSM的新鲜之势。私底下也有不少人有着这样的担心,“面对同业厂商对BSM的推崇,游龙或者ECC还能撑多久?”

  对此,游龙科技ECC项目经理赵琛宇指出:“IT管理,其本质在于管理学,而管理学首要要义就是,无法管理不能监测的数据。”那么对于现有客户,是先按照IT运维理念去架构,还是按照管理的角度先去做监测?对于这个疑问,赵琛宇认为,脚踏实地、遵循客观规律、符合实际应用环境最好。

  接下来就让我们通过对赵琛宇的采访,揭晓游龙科技对于BSM以及对于IT运维管理领域的态度和观点。

  追根溯源谈IT运维、IT管理和IT整合

  “IT整合是一个大趋势,IT管理的整合也是必然的大趋势。比如云计算、虚拟技术等,将一些庞大的应用都整合到一起。它可以把一台服务器划拨为多个服务器,实现一个台服务器支撑多个业务系统。这也是一种IT整合的应用体现。”对于当前IT运维管理所面对的市场现状,赵琛宇如是说。

  他表示,IT管理、IT融合之所以成为一个大趋势,主要是因为IT管理的需要。IT管理分为若干个线路,也就是说它有若干个细分的市场需求。比如,全国密布的高速公路网络,这个路网必须要畅通,如果一个路网不畅通,人们就无法在这个高速路上开展物流或其他任何业务。所以,路网很重要,回头来说IT运维、网络管理,它们同样涉及到各个细分方向,而且每个方向都很重要。

  首先,客户会要求IT运维系统对他们复杂的网络架构进行管理,包括服务器、网络设备、以及上面的各种应用系统、业务系统等等。用户需要对其网络体系进行精细化的监控,监控直到一个端口、一个链路。

  其次,用户需要对其服务器进行监控和管理。这非常重要,SiteView ECC提供的解决方案,包括服务器、业务、应用等的监测和管理。IT运维系统,还需要从客户体验角度来看,要考虑到是不是系统反应够快、性能够稳定等等。

  第三,网络管理中,还涉及对终端系统的管理。一个大中型的IT运维部门,要支撑成百上千台PC机的维护工作,如何减轻压力,提高故障处理能力,是IT整合发展的一个课题。软件分发、资产扫描、软硬件使用情况,都需要精细化管理,以便后期规避风险。

  第四,还有一些IT管理,需要对不可见的信息进行管理,如访问流量、员工的上网行为等。有很多公司受网络不明攻击,其实来源于一些员工的不良访问、或者防范意识不强等等,但很容易导致公司网络性能下降,影响公司内业务和工作的正常进行。

  “这方面如何规避、抵御,如何避免这些问题的发生,都是 IT管理者要考虑的问题。”赵琛宇抛出这个话题:“当然,也是游龙科技一直在探索和追寻的。”综上所述各种问题,我们才会谈及到相应的解决之道。游龙科技产品线的逐步推出,也是基于以上用户需求的不断呈现。IT管理需要整合,需要融合。

  因为一个IT支撑部门,可能会同时面临以上提到的各种问题的爆发。IT运维部门需要一个整体的解决方案,同时满足所有需求。比如刚才提到了的几个话题,若没有一套融合化方案,它可能需要用好几个不同的软件,开5个不同的窗口,登陆5次不同的密码,监测5个不同的界面,尤其是不利于以后数据的整合。

  谈及IT管理,必然要提到IT运维,同时也必然会考虑到IT整合。IT运维、IT管理、IT整合,是IT部门现阶段不可忽视的一个课题。在IT运维厂商、IT运维部门之间,如何能够更好达成解决方案和需求的契合,更好更快实现一种理想化互动,是人们都非常期待的一幕。

  数据监测和警报是做好IT管理的第一步

  赵琛宇指出,IT运维管理系统之说,来源于ITTL,来源与CMDB——核心配置管理数据库。CMDB的构建,必须依赖于基层的管理力度,必须把所有的网络设备、服务器、所有PC的运行状态,都监控齐全后,才能构建CMDB;若没齐全,就无法把一个故障流程弄成一个ITIL。而ITIL从V1.0到V2.0、3.0,从一大厚本儿逐步到一薄本儿,再次证明它只是一个理论,是一个概念,它只能指导客户要达到一个什么效果,而不能告诉客户如何去做。

  不可否认,ITIL确实是个好东西,但一定要结合实际。采用基于ITIL的系统,国内国外都有很多案例,失败的也很多。造成失败的原因主要有两个:一是原有架构不适合变更;二是管理的力度达不到,各环节协调不上来。另外,客户软件的使用习惯也是各不相同,是导致失败的原因之一;而软件本身,若底层并不是完全成熟,不能构建CMDB,也会造成失败。

  现在国内ITIL是一个初步培育期和探索期,并不成熟。国外也是从这个阶段过来,国外也不是立马就上一个体系架构,它都需要一个过程。游龙科技建议先上一套管理思想,一个可执行的流程和思想,它是非电子化而是纸质化。用户可以先找一家咨询公司,将纸质化的管理思想走几遍,各环节都认可都磨合好了,再选择一个适用的ITSM(IT服务管理)。

  赵琛宇反复强调,IT管理,其本质在于管理学,而管理学首要要义是:无法管理不能监测的数据。因此,首先,要采集数据;其次进行数据挖掘和展现。“有了完善的测量数据,才能把IT管理做到最好。”赵琛宇说:“游龙科技苦练内功,并不急于尝试覆盖性功能,而是首先脚踏实地帮助客户解决好IT管理的第一步——数据监测和警报。我们的目标是,将监测值采集和警报管理做到业内最精准。”

  据介绍,在采集监测数据方面,游龙科技使用了外围的模拟用户操作方式。比如,模拟网站登陆者登陆网站,从网站提取性能数据,进行比对和校验。从工作方式来讲,ECC不会对客户服务器造成压力,它从客户用途的角度,来体验它的业务系统是否够快。比如刚才提到的网站性能监测,大概用几秒钟,就会把数据加载下来。若某网站从去年8月到今年6月,平均一个页面的打开速度是1.2秒,那么ECC会把1.2秒作为报警的基线,超过1.2秒的延迟就会进行告警提示。

  而对于用户来讲,他们需要监测什么、监测多少性能指标,这些完全可以做到订制化。比如一般中小型企业,或者中型企业,它的服务器不会很多,监测指标并不需要太多,毕竟像移动梦网那样的全国性项目并不多。

  具体来讲,游龙科技所追求的数据监测工作主要体现在如下5个方面:

  1.基于监测,不断提高报警的准确度。这一点非常重要,漏报、误报都是客户无法忍受的。赵琛宇举了一个银行的例子:曾经有一位ECC的银行用户,凌晨三点连续收到三条短信报警,因为核心网断了。虽然这种情况很不可思议,因为银行系统一般都会做容灾备份、双机热备等预备性工作,但是千分之一机率的故障,也还是出现了。一旦出现这种情况,报警越快则越有助于快速解决问题。

  2.解决误报问题。游龙科技在警报误报上做了很多改进。比如,一个网络系统,从监测机主机到被监测主机之间,会经由很多路由器、交换机。一个网络设备的故障,会造成一片网络主机的中断,会导致很多业务系统的中断。这个时候是报警网络设备故障,还是报警服务器系统崩溃?SiteView ECC会追根溯源,自动、智能进行准确报警,快速定位故障根源,节省故障排查时间。

  3.从管理角色来讲,SiteView ECC把故障分为两种:一种故障报给系统操作人员,一种故障报给领导和管理人员。从系统用途来讲,系统故障会直接报给相关的负责人,实现报警信息的准确传达。

  4.SiteView ECC也很注意一些报警的细节处理。比如,网络出现短暂的异常,瞬间异常被抓取到。这时候警告还未确定,监测器会立刻加大监测力度,在下一次数据采集中重点进行监测,以便确定是否告警。因为在这种快速监测情况下,难免会出现抖动状态。IT运维厂商必须解决各种漏报误报问题,不然就会演变为IT版“狼来了”的故事。用户会逐渐放松警惕,一旦真有问题发生,不能得到及时关注和处理,就为时已晚。

  5.为了提高数据的价值,游龙也在不断改进、不断提高报表的功能。不同的客户有不同的需求,为此游龙提供给用户自定义报表功能,从管理者角度、一线运维人员角度等不同角度,来覆盖客户所有需求。同时,用户可以根据自身需求进行报表个性化定制,用户也可以通过EXCEL的公式进行报表直接调用。其中,有一些公式是SiteView ECC自有的公式,输入公式即可直接调用、展现。

  游龙发展史及其与网管软件、IT运维的关联

  市场趋势已然是在融合与整合间提出对IT管理的需求,但是从业的厂商,譬如游龙,也是跟随市场的发展形势而不断调整自身的产品方向的。

  2000年,游龙科技成立之初,国内市场一片空白,IT运维市场基本都是被国外几个巨头垄断。2004年左右,经过三年沉寂和积累,游龙科技在国内IT运维领域爆发,开始不断斩获丰收。随着在国内不断累积的市场影响力和持续不断的项目成功实施,游龙科技逐步在国内市场崭露头角。

  ECC是游龙科技一直以来的主打产品之一,它是一个综合性网管系统,它关注IT网络的服务器、网络设备和应用系统的运行状态。“IT整合是个大趋势,游龙科技从ECC开始,逐步实施IT运维融合战略。”赵琛宇介绍说。

  继2003年ECC推出后,2004年游龙科技又推出SiteView NNM(网络设备管理),又在随后的三年内陆续推出SiteView EIM(上网行为管理)、DM(桌面管理)等系列产品。2009年初,游龙科技推出SiteView VLAN虚拟局域网解决方案,同年6月又推出基于TR069的电信级网管系统SiteView TRO69(智能设备管理)。

  可见,IT整合是一个大趋势,IT管理的整合也是必然的大趋势。纵观国内IT运维领域,游龙科技在IT管理理念、用户需求、产品研发等方面,一直遥遥领先。同时,随着IT运维领域产品线的逐步完善和成熟,以及IT运维各系列产品之间的数据融合,游龙科技与理想化的IT运维整体解决方案日益接近,可以很好地满足国内用户不同阶段、各方面的运维需求。

  赵琛宇认为:IT融合是必然的趋势,是IT管理的前曲目。从IT运维的角度看,只有实现了服务器管理、设备管理、PC终端管理、上网行为管理等诸多IT运维细分领域的融合,才能真正构建CMDB,实现IT运维数据的融合,进一步实现真正的IT管理。

  对于IT运维管理来说,赵琛宇表示,有这样几个关注点值得跟进:集中监测是IT运维管理的起点,要实现全面、深入、集中监测,应该包括服务器、网络设备和应用系统等方面;批量修改监测参数、自动添加告警规则、自动添加报表等,是大规模自动化监测系统的必备功能;准确实时报警是快速解决IT故障的开始,要能消除误报和漏报;IT管理的重点在于运维管理报表,尤其是自定义报表;好的运维系统,应具备丰富实时的数据展示形式,如visio图、树状视图、鱼眼视图、虚拟组视图等。

  作为基础运维管理系统的当前优势

  正如赵琛宇所说,我们在谈及市场需求和用户需求的时候,需要考虑国内IT运维部门或信息中心目前处于哪个阶段。同时,也需要从不同角度来全面考虑IT运维的应用。

  从市场的角度来讲,网管软件,都是属于成长期,尚不属于成熟期,因为不是所有客户都已经成功实施各种各样的网管产品,大部分的客户还有很大的空白。

  从客户关注度来讲,首先要关注的是网络连通性,以及服务器的性能。

  从管理人员角色来讲,也有不同的需求和关注点。用户管理层更关注业务系统的持续性,他们有很多的业务、很多的系统,需要7X24小时不间断运行;若是系统出现了问题,将会对业务、对公司造成直接的经济损失。而面向终端PC机的管理系统,是IT维护部门一线人员更需要的东西,因为它是实实在在、能有效降低其工作量的管理工具。

  SiteView ECC是游龙主打产品之一,经过多年的升级和改造,性能越来越好,用户对SiteView ECC的需求也越来越多。游龙在IT运维领域持之以恒,坚持创新,不断推出更好的产品。我们看国外的产品和国内产品的比较,无论从界面到技术,都有很大差距。国内产品非常注重界面,非常美观,国内研发工程师孜孜不倦,追求界面美观度,当然这和国内用户的需求引导有关。

  现在,国外厂商界面仍停留在黑黑的窗口阶段,更多优势在于反应数据的真实性和准确性。而国内,则更多的是关注界面和展示。可喜的是,现在国内厂商和用户,日渐趋向理性化,逐步开始清楚明白,监控系统对于一个客户的价值,更多在于监测的实时性和准确性。若IT运维厂商能把监测做得更丰富、报警做得更准确,客户自然会更快发现它的价值所在。

  那么如何选择一款极具竞争力的网管软件呢?

  赵琛宇认为,好的网管软件,需要先做到深入监测。那么,目前的系统监测,IT运维厂家能做到什么程度,最好的产品表现又是如何?功能细节和易用性、安装简易性到了什么程度?以上,是我们在选择理想理性状态的网管软件时必须要考虑到的问题。

  同时,还需要考虑网管软件的成熟度,成功应用的项目和案例有哪些,同行的应用程度如何……诸如此类,还有很多问题需要我们在选购时去考证、去衡量。

  作为国内主流的IT运维厂商之一,游龙科技更多努力在于修炼内功,而非外功。游龙科技SiteView ECC监测器达到几千个,无论从服务器、数据库,到业务系统和应用系统,游龙科技都可以提供全面、深入的监测和管理。目前新兴涌起几个厂家做类似品,从技术参数和功能上来讲,似乎这些功能都有,但真正“用”的时候,用户自会发现这些功能实际上并不如表面上那样光鲜。毕竟,一个技术或方案的成熟,需要经验的累积,需要技术的沉淀,需要项目的磨砺等等。

  “游龙SiteView ECC产品有很多亮点,从最早监测服务器基本性能,到后来升级到数据库监测、中间件监测等等。”赵琛宇不无自豪地说:“我们可以看到非常多的监测参数性能和范围的不断增长,游龙监测指标随市场变化和需求变化一直不停在更新。从监测指标数量来看,已经从最初的几十个监测指标猛增到现在的几千个监测指标。”

  另据了解,从大规模数据迸发来讲,基于九年来的市场和技术沉淀,游龙在IT运维领域具有独特优势。比如,ERP主要是关系型数据,而SiteView ECC的数据不单要入库,还要做查询和对比。如此大的数据库增量,移动梦网每天2800万次之多的数据采集和匹配,一般的数据库无论做多大优化,都很难实现。游龙科技则采用自有解决方案,SiteView ECC以大型关系型数据做备份更新,而实时的查询、操作,统一放到游龙自有的缓冲数据库,可以支持大数据的查询和匹配。

  此外,无论多庞大的数据,都可以快速启动和运行SiteView ECC界面。SiteView ECC做了多种优化,比如从功能性上优化。游龙科技倡导无论多么复杂的功能,点击不超过四次即可实现。游龙不断创新,不断细化,不断给客户带来便捷。SiteView ECC每次点击鼠标的时间响应,最长不超过10秒。这是游龙“4次和10秒”的口号体现。

0
相关文章