产品数据分析系统用户手册.docx
《产品数据分析系统用户手册.docx》由会员分享,可在线阅读,更多相关《产品数据分析系统用户手册.docx(36页珍藏版)》请在课桌文档上搜索。
1、产品数据分析系统用户手册V1.O1系统介绍综合资源数据分析系统基于先进的E1.技术,采用B/S架构,包含主题分析、专题分析、报表报告等多种分析功能,提供表格分析、趋势分析、同比、环比分析、分布分析、对比、关联分析等多种分析方法,使用人员还可以根据需要,自定义指标、维度、历史数据范围等,以多种直观、灵活的方式展现。实现短信、彩信、手机上网等重点业务端到端的质量分析;实现网络隐患的积极发现与溯源;实现多专业的平常分析和跨专业的网络专题分析;呈现资源瓶颈、呈现质量短板、呈现关联信息支撑生产和优化方案制定。综合资源数据分析系统面向维护、面向质量、面向经营,通过提取、整合专业网管、综合网管、业务管理、运
2、维管理、市场支撑在内的各层面系统的信息资源,通过对信息深加工和智能化分析挖掘,提供“可视、可分析、可溯源”的能力。打通与BoSS系统接口,结合BSS数据进行跨域分析,解决网络资源的精确投放问题;综合资源数据分析系统提供灵活自定义功能实现多专业的平常分析和跨专业的专题分析,提高运营维护效率,同时也大大减轻了一线人员的压力。2系统设计2.1 系统逻辑架构Pig(DataFlow)Hive(SQ1.)MapReducefJobSChedUling/ExecutionSystem)Hbase(ColumnDb)HDFS(HadpDistributedFileSystem) 不准确问题数量 不一致问题数
3、量 不及时问题数量 不有效问题数量 不完整问题数量数据质量解决情况指标 数据源接口问题总数量:指在一定期间范围内,数据源接口出现数据质量问题的总数量(涉及反复出现次数); 问题解决完毕比率:指在一定期间范围内,解决完毕的数据源接口质量问题数量与数据源数据质量问题总数量的比值; 问题平均解决时长:指在一定期间范围内,数据源接口质量问题解决总时长与数据源数据质量问题总数量的比值; 重大问题出现次数:指在一定期间范围内,出现重大数据质量问题的次数,如:影响增值业务话单接口数据质量问题等。数据源接口质量评估功能规定在元数据管理模块中配置数据源接口质量评估规则,并进行数据源接口质量评估规则的管理。数据源
4、接口质量评估规则是指:根据数据源接口质量问题各指标对综合资源数据分析系统数据质量影响限度的不同,在元数据管理模块中定义与各指标相相应的评分规则。数据源接口质量评估规定数据质量管理子系统将每月的数据源接口质量评估结果及时发送给数据源系统相关管理人员。数据源接口质量评估报告应具体反映当月数据源接口质量问题情况,重要应涉及以下内容:1)评估月份2)数据源接口质量问题各指标值3)数据源接口质量评分接口侧质量问题、发生时间、问题类型、严重级别、问题描述和解决结果。3.2.5数据质量对外服务数据质量管理子系统是综合资源数据分析系统的有机组成部分,通过与综合分析其它模块的信息交互可以提富数据质量管理子系统的
5、运用价值。同时,数据质量管理子系统自身也可以运用这些服务功能。数据质量对外服务功能一般以界面集成(页面嵌入)或服务接口调用方式供综合分析门户使用。3.2.5.1 数据质信息查询功能数据质量信息查询可以分为以下两种信息的查询:D数据质量问题查询:可以查询单个或多个对象在某个时间段内的数据质量问题,对于存在数据质量问题的信息给予特别显示(如红色字体、闪烁等),以引起运维人员的注意,运维人员可以从该指标对象出发进行问题的分析与解决。2)数据质量记录查询:可以查询某一维度或几个组合维度的数据质量记录信息,如在综合资源数据分析系统中使用该查询功能以显示上周数据质量问题总量、接口到达率等。3.3数据采集管
6、理3.3.1 数据采集3.3.1.1 积极检测积极检测为积极采集的发起方。检测数据源端数据完整性,检测到数据完整后积极发送触发采集的消息。积极检测需要具有较高效率,最大限度减少由于检测导致的数据源侧负荷。检测功能重要涉及检测任务生成和检测任务执行。检测任务生成需提供配置功能,可对检测对象、检测周期、理论数据条数、经验时间点等参数进行配置。各个数据源应当优先提供数据库接口,对于数据库接口可以根据设定的某测量当前时间的理论数据条数、该测量最近一段时间的平均数据条数和指标检查规则来检查数据源侧数据的完整性。对于其他接口方式可以根据具体的接口特性进行检测规则的设立。考虑到当前数据源侧的数据质量的不稳定
7、因素,积极检测模块应当可以对数据源侧的数据入库时间戳进行辨认,对于变化的数据应当具有重新采集的能力。也可以通过对数据源侧的数据库日记进行跟踪,感知数据变化从而触发采集。3.31.2对数据源侧触发消息的接受综合资源数据分析系统应当提供消息接受能力,即可以接受各专业网管发送的专业网管数据准备好告知消息,及时进行数据的采集,当专业网管进行数据补采后,也能及时触发综合分析进行数据补采,最大限度保持数据完整性。规定综合资源数据分析系统具有较强的并发能力,不丢消息,在1分钟内完毕消息入库,保证后续能及时进行采集。331.3数据采集解析数据采集适配器负责按照接口类型、特性从不同的数据源通过文献接口、指令接口
8、、数据库接口等方式从网元、OMC侧或其他网管侧获取基础数据,然后对获取到的原始数据进行格式标准化,写入数据缓冲区。采集适配器应当为支持二次开发的程序或组件,对于同一种接口类型、接口特性的多个数据源应当作为同一个程序的多个实例存在,而只针对不同的接口类型设定不同的适配器。采集适配器应当具有可视化的配置管理能力,即可以通过图形化界面对不同的数据源选择不同的采集适配器进行数据采集,并对不同的数据源根据实际需要,可视化的配置需要采集的数据范围和相应的约束条件。对于数据源侧的数据配置信息应当从元数据库中获取被采集侧元数据,并在采集模块的配置界面中通过可视化界面进行采集范围的选取。对于数据的格式标准化,应
9、当遵照ODM-A相应模型的约定,尽量保持原有数据源侧的模型结构。3.3.1.4数据装载把格式化的数据写入到ODM-DB数据库中,数据入库策略支持增量入库、全量入库方式。增量入库:只把采集到的新数据入库;全量入库:采用把数据库中数据先删除后入库方式。331.5数据智能补采根据数据的完整性情况,和数据补采策略,可以自动重新发起采集任务,把数据重新进行采集,保证数据的完整性,最大限度和数据源侧保持一致。3.3.2数据转换3.3.2.1 数据抽取从ODM-DB中获取数据,加载到数据缓冲区。数据缓冲区可以采用文献方式或者数据库方式;假如采用数据库方式则需要对临时数据和正式数据分开存储。332.2数据清洗
10、数据清洗负责对“脏数据”进行剔除,消除数据的不一致。“脏数据”涉及不规则数据、不符合事实数据,如:取值范围、完整性规则、拼写检查等。对于数据清洗过程规定具有完善的日记功能,日记内容需要记录数据清洗的因素,被清洗的数据存放到哪里和被清洗的记录数。在元数据管理中已经对数据的基础值域范围进行了描述,数据清洗模块可以从元数据管理系统中获取相关信息进行数据解决。三关键字管理3.323数据转换建分芟修改分矣热蹄分关S-Qj蒙第分其Q日立庭机一日数Ig胃a0月勖据机他月数得Tfl90公共数据全广彝参数*机18款定参数数据转换重要涉及如下三个方面: 统一网元数据编码,将不同数据源的同一网元的数据集中转换成统一
11、格式编码; 转换数据类型,对与目的数据类型不一致的数据进行转换; 转换数据格式,对与目的数据格式不一致的数据进行转换。在该模块的程序日记中,需要记录数据转换的因素和记录数。数据转换算法应当可被元数据管理系统辨认并采集。3.3 2.4数据装载直接加载数据缓冲区中无需此外解决的“干净”数据;加载通过清洗和转换后的符合目的数据模型的数据;加载成功后,删除缓冲区中相应数据,并写进日记文献;加载日记涉及加载记录数和加载时间戳。3.3.3 数据汇总数据汇总算法重要涉及:汇总时间粒度、汇总网元粒度、汇总映射算法等,采用元数据方式描述。需要将细粒度数据根据维度层次汇总成高粒度数据,包含时间、空间粒度、业务等汇
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 产品 数据 分析 系统 用户手册
链接地址:https://www.desk33.com/p-1398099.html