网络通信 频道

运营商应如何把数据集市推广下去

  随着中国移动省级经营分系统1.5实施的尘埃落定,各个集成商为了完成项目进度而疲于奔命的紧迫感也暂得到缓解。然而,系统虽然上线了,但遗留的问题并没有得到很大的改善,新的问题也随之而来,留给运营商负责人员和集成商的项目技术人员的很多问题需要解决。

  针对经营分系统1.5中重要的数据集市模块的应用,百纳电信咨询根据系统目前的运行情况,做了定向分析。

  数据集市的现状分析

  本质:数据集市是对数据仓库进行了进一步的汇总,面向特定的应用,主要应用于报表和部分主体分析,以及即席查询等。数据集市能否最大限度的满足客户的需求,还得看各个省的数据集市的模型设计是否合理和是否具有前瞻性。

  局限性:目前还是通过前台界面的即席查询功能为入口访问数据集市(个别省会把一部分数据下传到地市),访问方式单一,灵活性不足。

  数据质量:决定着系统建设的成败,在数据准确性等方面,很多省还需要大幅的提高,需要积极地去推动。

  首先,要把数据集市很好的推广下去,不可避免的要先谈到数据的准确性,首要保证的也是数据的准确性。

  数据准备性:不论经分系统在一期还是现在的二期,数据质量问题始终存在。有些省在数据质量方面更是存在比较大的问题,就系统二期的使用而言,一些省公司还是跟建设经分的初衷存在一定的差距。不管引起数据质量问题的是什么原因,起码数据的准确性是决定着系统建设成败的关键,直接影响着用户的使用率和系统的推广度。

  然而,影响数据准确性的问题是多方面和多方位的。以下是影响准确性的关键点:

  (一)数据源的准确性

  1。单一数据源数据本身存在问题

  虽然系统建设已经好几年了,也由一期走向了二期,但是,由于源数据的提供是其他的系统,它们不会随着经分系统的完善而完善,源数据的系统也在不断的完善和升级,它们也需要调试,加上负责人员的流动等因素,难免会出现处理数据或者生成的数据出现问题,特别随着业务的发展,要求新加载的数据不断的增多的情况下,因为都要相互有个了解消化的过程,所以出现问题在所难免。但是,为了避免此问题的出现,不仅要做好数据接口和对工作,还要求不同部门之间协调积极,配合积极,另外不同系统的负责人和技术人员也要积极地沟通。

  2。不同数据源之间存在数据重叠

  比如BOSS系统与彩玲平台数据,BOSS系统与大客户系统等,因为不同的系统间有些数据需要彼此传递或者计算等,还有的是出于数据的颗粒度问题以及数据存储、分析的目的灯,造成数据源之间出现数据不一致的情况,转而就会带到经分系统。这个时候很大程度上需要统一口径,统一口径的问题又是造成数据准确性的一个重要的因素。

  (二)调度程序问题:

  1。自身的bug

  需要的不断提出等原因,造成程序都是在不断的改进和完善之中,特别是那些新开发的程序,即便是技术人员工作能力再强,在为了完成任务或者赶进度而和时间赛跑的情况下,效率自然会降低,也难免出现问题。这些就要集成商对程序质量方面有完好的质量控制体系,运营商要有好的监督体系,而现在各个省的经分系统的项目上,这方面作的并不是很好,值得大家重视。

  2。处理过程造成数据差异,如一些转换规则

  在一些人为手工维护的数据,如一些帐单类型,数据类型,用户属性方面等等,由于不及时更新或者数据同步,也会造成数据出现问题。另外一些程序把转换规则直接写进程序,当规则改变时,程序没有及时更改,造成数据差异。

  (三)数据库处理问题:

  1。程序逻辑问题

  是程序在处理数据时,关联不同的表出现的逻辑性错误,使处理后的数据增多或者减少,或者限制条件出现问题,计算数据不对。

  2。统计口径问题

  是目前数据仓库和集市遇到的普遍存在的问题,牵涉到各个环节。其中也有客户内部的问题,比如不同部门之间的统计口径不同,不同负责人员要求的统计口径不同,甚至要求的口径一变再变。还有就是技术人员之间的理解不同,缺少沟通,造成统计口径差异,引起数据不一致。

  3。程序自身bug

  由于程序本身不完善,造成处理数据的时候出现问题,比如对数据的增删改出现问题,数据没有被同步处理的问题,造成数据前后不一致。或者是因为程序异常,而本身没有加以判断,造成数据出现问题。

0
相关文章