XX学院数据治理平台建设项目采购需求.docx
《XX学院数据治理平台建设项目采购需求.docx》由会员分享,可在线阅读,更多相关《XX学院数据治理平台建设项目采购需求.docx(58页珍藏版)》请在课桌文档上搜索。
1、XX学院数据治理平台建设项目采购需求一、项目背景自建校以来,学校根据国家政策要求和学校发展需要,积极推进信息化建设,建成了覆盖全校的校园网络基础设施以及一批基于业务单元的应用系统(如教务系统、0A、财务系统、人事系统、科研系统等),并搭建了基础平台,包括统一身份认证平台、共享数据中心、数据清洗与整合平台和信息门户平台,解决了面向用户的门户使用,进行了数据的集中整合。在一定程度上,达到了预期的目标。根据学校信息化现状的分析与研究,目前学校在信息化建设方面虽已取得一定成效,但仍有许多问题亟待解决:1、已有数据标准,但标准不满足目前现状。学校数据标准及信息标准滞后,不符合目前学校行情及国家行业标准。
2、目前校级信息标准已不能指导目前数据中心的信息化建设,参考标准难取用,代码标准、接口标准、下行开放标准缺失,信息标准电子文档难维护、难使用,缺失关键数据管理细则、数据标准管理报告等问题突出。2、数据质量问题突出,缺乏数据治理能力前期共享数据中心建设主要解决了学校各部门数据孤岛问题,实现了基础数据集中管理、达到数据共享交换的目的。但是数据质量问题、数据同步、缺失问题还是很普遍,一方面以往关注点主要是在基础的主数据交换,另一方面数据质量的管理难度大,缺乏工具和标准,处于比较粗放的状态,对数据治理的重视程度也不够高,制度上也缺乏保障。加之在大数据背景下,各种应用系统产生的数据越来越多,越来越快,同时师
3、生服务、管理、决策、以及教学科研的各种活动对数据质量和可信度要求也越来越高。3、重复填报、统计过程繁琐从学校实际情况来看,每年各类业务填报没有数据支持,还在采用较为原始的纸质手段进行,使得数据项重复填报、业务系统数据无法提供支撑,已经沦为常态,同时,数据质量还面临巨大的考验,填报的准确性有待考量。二、建设目标本次项目总体建设目标是从学校当前的建设现状出发,实现学校信息化建设的现代化和智能化。通过开展以需求为导向、以互联共享为核心、以信息安全为保障的信息化建设,推进以数据共享为目标,整合学校多源头的数据资源,治理学校数据资产,帮助学校建立起一套合规的、可持续提升的数据规范体系,保证对于核心数据资
4、产的沉淀和积累,真正达到数据的准确性和权威性保障。主要包括以下几个方面:建设符合学校实际情况的校级数据字典和信息编码标准,包括各类信息子集标准、代码标准、数据交换标准、接口标准、数据模型标准等;编制学校各项数据管理规章制度;建立各信息系统与数据中心的数据交换机制,保证系统之间相关数据及时同步,打破信息孤岛;建设学校全量数据管理平台,对学校教务、人事、科研、财务、0A、一卡通等主要信息系统生产的数据进行全量采集、清洗整合、主题分类、分层管理,以师生数据全生命周期为主线,实现全校资源数据的有效存储与管理;建设全校数据质量监控体系,保证进入数据中心数据的规范性、完整性、一致性、准确性,定期发布数据质
5、量报告;建设数据填报平台,满足缺失数据、临时数据、报告报表数据的填报采集需要;具备信息标准、全量数据、数据交换使用可视化大屏分析展示平台。建设数据开放平台,让全校师生共享数据治理成果,并参与到学校的数据治理过程中,提高学校数据质量,建设学校自己的数字化的智慧的校园。三、建设内容序号建设内容数量单位备注1全量数据中心1套/2全量数据质量管理平1套包含12个业务系统的数据质量台检测3全量数据开放平台1套4一表通平台1套包含50个表单设计5系统集成10个包含10个新增业务系统的系统集成6数据大屏2个大屏最终内容以校方确认为准四、技术、功能指标序号技术、功能指标1全量数据中心1.1基础性框架软件1.1
6、.1为学校搭建大数据平台和各种组件,包括但不限于以下内容:提供各种能够快速稳定运行的数据计算框架,如Spark;使用ApacheImpala做为对HDFSHBase的高性能SQL查询引擎;使用Hive数据仓库工具帮助用户分析数据;提供CM安装HBase分布式列式NoSQL数据库;包含原生的Hadoop搜索引擎以及ClouderaNavigatorOptimizer去对Hadoop上的计算任务进行一个可视化的协调优化,提高运行效率;提供的各种软件能让用户在一个可视化的Ul界面中方便地管理、配置和监控HadOOP以及其它所有相关组件,并有一定的容错容灾处理;提供基于角色的访问控制安全管理。1.1.
7、2l.l.Iw所提到的大数据分析的相关框架软件,其名称、版本不做强制要求,投标单位可以按自己的中台软件产品灵活进行软件系统架构设计,但其中台产品必须有明显的基于基础性框架软件进行设计、构建的相关描述及设计概要说明。1.2全量数据标准管理系统:信息标准的实施是数据治理的首要措施,是数据运用的基石,在数据中心架构设计的过程中,数据标准将一直影响和指导学校的业务发展,并提供权威参照依据,标准也会随着需求的变化而不断的更新。1.2.1技术性需求1.2.1.1平台需内置包括2012年部标【教育部-教育管理信息标准-高等学校管理信息(JY/T1006-2012)】、2013年国标【中华人民共和国国家标准G
8、B/T298082013】、2018年国标【中华人民共和国国家标准GB/T35298-2017以及行业经验标准等;内置的参考标准应支持任意取用、下载;支持自定义标准。1.2.1.2基于国家标准和教育部标准,在现有学校信息标准的基础上,建立完善学校数据标准体系,包括数据集标准与数据代码标准,并支持可视化管理。1.2.1.3平台需和全量元数据及关系管理系统可实现联动,支持四层标准草案的管理,包括原始层、主题层、统计层、应用层标准的在线配置、模板导入和批量取用。1.2.1.4要求提供所投产品适配国产数据库、国产操作系统和国产服务器的国产化软硬件认证证书复印件。1.2.2功能性要求1.2.2.1数据管
9、理员首页:系统应提供数据管理员首页统计展示,应支持对参照标准统计、全量数据中心采标率统计、标准草案统计。1.2.2.2参照数据标准管理1.2.2.2.1参照数据标准首页:应支持数据集、代码集的查看、下载,支持新增/编辑数据集,发布/停用数据集,下载和配置数据集。1.2.2.2.2参照数据标准配置页:系统应支持自定义数据集,内置数据集、内置代码集功能,应提供标准内容的导入/导出;新增目录/表/数据项,且必须支持批量新增;支持删除目录/表/数据项,且必须支持批量删除;提供批量取用已发布参照标准的功能。1.2.2.3标准草案管理:需管理学校自定义的标准草案,在成为执行标准前支持在此页面进行标准代码集
10、、数据集的单独管理、维护。需支持学校自定义标准草案时新增、修改、删除、配置等基本操作。1.2.2.3.1草案首页:应提供标准草案的拟定功能,包括数据集、代码集的新增/编辑/删除和发布。1.2.2.3.1.1新增标准草案:需支持新增草案,提供输入草案名和草案描述的功能。1.2.2.3.1.2信息标准发布:需支持学校自行编辑的信息标准,信息标准内容只有通过发布才会成为本校执行标准,提供给其他普通用户查看。1.2.2.3.1.3信息标准删除:需支持删除学校自行创建的信息标准。1.2.2.3.2草案配置页面:草案配置页面应支持取用参照标准、自定义标准草案、批量导入标准内容。1.2.2.3.2.1需支持
11、数据集的分层管理,支持每层标准内容的导入导出;应提供批量取用数据集标准(已发布参照标准、执行标准、元数据);应支持批量新增目录/表/数据项,编辑目录/表/数据项,批量删除目录/表/数据项;需提供移动数据项功能。1.2.2.3.2.2需支持代码集管理,应提供标准内容的导入/导出;应提供批量取用代码集标准(已发布参照标准、执行标准、元数据);应支持批量新增目录/表/数据项,编辑目录/表/数据项,批量删除目录/表/数据项;需提供移动代码项功能。1.2.2.4执行标准管理:需对经标准草案发布的标准(数据集和代码集)进行管理,能查看数据集、代码集,支持对各个历史发布版本进行统一管理。并能设置和取消各发布
12、版本的执行状态。同时支持一键同步标准数据表至全量数据中心元数据。1.2.2.4.1执行标准首页:应支持数据集标准管理,应支持下载执行标准数据集文档、基础信息展示、结构图谱展示、更多版本管理、执行标准同步至元数据。应支持灵活选择管理标准分层(原始层、主题层、统计层、应用层)一键同步至元数据。应支持代码集标准管理,提供下载执行标准代码集文档、基础信息展示、更多版本。1.2.2.4.2执行标准配置:需支持数据集分层管理,包括预览建表语句、批量导出建表语句、批量导出标准内容;应支持代码集的批量导出标准内容。1.2.2.5数据中心采标率:需支持查看数据中心采标率,需支持查看不同业务系统中表的历史变化情况
13、。1.2.2.6标准对比分析管理:通过不同标准之间、标准与元数据之间的对比,应支持通过图形化、数据表形式体现目标标准与对比标准的详细差异。1.2.2.7标准管理办法:协助学校根据实际情况制定出适合本校的数据管理办法,并支持管理办法的新增/编辑/删除/下载和在线预览。1.2.2.8提供数据标准管理的功能演示,要求演示标准草案的制定可以灵活取用参考标准的功能,实现对标准的在线制定;要求演示灵活选择管理标准分层(原始层、主题层、统计层、应用层)进行标准管理的功能,支持导出标准内容的功能;演示标准的结构图谱以及更多历史版本标准的查看功能。1.3全量元数据及关系管理系统:全量元数据及关系管理系统用于管理
14、全量数据中心的所有元数据的产生和迭代过程,记录元数据与数据中心结构的变化,客观反应数据业务属性、技术属性和管理属性,基于元数据的管理功能,有效解决元数据和数据标准之间的业务连续性问题,建设为实现教育业务系统间的数据资源共享与信息交换以及实现业务综合报表、决策知识挖掘、决策分析提供的基础支撑。1.3.1技术性需求1.3.1.1基础性技术要求1.3.1.1.1系统需采用开放、标准的数据库设计。平台需基于SOA思想,以XML为信息交换语言,需支持跨平台部署,对数据库中的表与数据项都提供中文备注。1.3.1.1.2数据来源需支持完全自定义模板配置,需支持可编程化查询语句有效兼容了所有业务数据查询方式,
15、需支持对外提供开放的数据访问服务接口,并实现对服务接口的管理,需支持对服务接口名称和描述的编辑,以及对接口的授权管理。1.3.1.1.3系统需遵循“谁产生、谁维护”的原则,所有的数据都有唯一的产生者和维护者。在管理上,需通过制定相应的应用规范要求数据生产者/维护者及时更新自己负责的数据,从而保证全量数据中心的数据按照学校信息标准更新。1.3.1.1.4系统需提供覆盖了全面的日志记录,需实现用户对系统标准的变更,元模型的变更,以及数据服务调用都是有详细的日志信息可以追溯。1.3.1.1.5要求提供所投产品适配国产数据库、国产操作系统和国产服务器的国产化软硬件认证证书复印件。1.3.1.2其他要求
16、1.3.1.2.1整体架构要求:整体架构需采用分层设计的方法,各层具有独立的功能含义和实施要求。需包含:原始数据层、主题明细层、汇总统计层以及应用数据层。详细如下:1.3.1.2.1.1原始数据层(原始层):原始层数据结构与源业务系统最为贴近,设计功能要求与业务系统松耦合、源业务系统数据接入完整、数据的增量识别、短期的历史数据、高效的数据接入、中心库的数据来源、完整的源业务系统数据明细。1.3.1.2.1.2主题明细层(明细层):设计功能要求:数据按主题存储、快速的数据查询结构、统一的业务编码、中长期历史数据、与行业标准结构贴近、完整的业务相关数据明细。1.3.1.2.1.3汇总统计层(统计层
17、):设计功能要求:数据可以是汇总数据、可以是快照数据、不包含明细数据、可满足初级的统计要求;是数据分析常用的数据源。本层数据主要由应用层展现要求而反推出的汇总中间数据,一般不是最终结果数据,而是大粒度的半结果性数据,主要作用在于提高后期查询互动的性能。1.3.1.2.1.4应用数据层(应用层):设计功能要求:数据根据实际数据需求生成,满足表格、图形等数据展示和应用;是数据计算的最终结果,无其他数据处理过程依赖此数据库。此层数据形式大都是简单视图方式,提供给各应用系统(如门户、综合校情分析、手机门户等)直接使用。其创建需求就是来自于各应用系统的数据接口需求。1.3.1.2.2数据流向要求:数据流
18、向要求数据能够从各个系统的接口出发,通过ETL工具将数据抽取到原始层,然后再根据主题数据标准的映射规则将原始层数据通过已有数据清洗与整合工具进行清洗、转换并装载到主题层,再根据分析需求,将主题层的数据做相应的计算并装载到统计层。最后,将门户需要展示的数据视图、报表中心需要的数据视图、个人中心的数据视图以及数据中心对外的接口表或者视图写到应用层进行统一管理,实现对数据全生命周期的管理。1.3.2功能性需求1.3.2.1数据管理员首页:系统应提供数据管理员首页统计展示,应支持数据中心总存储空间统计、数据中心表总数统计、数据中心数据项总数统计、数据中心数据总条数统计、参与数据交换系统(平台)总数统计
19、、流入数据总条数统计和流出数据总条数统计;并可查看今日数据中心数据流向一览。1.3.2.2元数据管理1.3.2.2.1数据集元数据:基于数据中心四层架构模型,通过数据集元数据进行每一层元数据的管理,需提供个性化的配置方式支持在线配置数据集。支持界面增删改等基本操作,也包括手动/自动全量同步元数据至全量数据中心、反向同步至元数据,并可立即检测源表对比情况。系统需支持每一层的统计信息展示,原始层元数据需展示机构/平台的统计,集成的业务系统统计,表/视图个数/数据项统计系统应支持批量导出数据集、批量导出SQL、批量导入数据集;支持对目录/表/数据项的新增、编辑、删除;需具有更新待同步表至全量数据中心
20、的功能,更新变化表至元数据、移动数据项排序。系统应支持自动识别原始层的表是否存在转换(有原始层映射关系则代表有转换),若不存在转换则支持“在线生成转换”。是否配置转换的更新频率应与自动提取映射关系强相关。系统在线生成转换的转换需符合命名规范:上行业务系统名称.表中文名称。1.3.2.2.2提供元数据中数据集源表采集以及在线自动生成转换作业的功能演示,演示对业务系统所有权限范围内表的源表采集,并演示同步至全量数据中心;演示在线的对表进行转换作业的自动生成功能。1.3.2.2.3数据集元数据结构图谱:系统需支持图形化展示各层数据集元数据机构,展开/收缩子集分支。1.3.2.2.4代码集元数据:需管
21、理全量数据中心代码表表结构,提供个性化的配置方式在线配置数据集。支持界面增删改等基本操作,包括手动/自动反向同步至元数据。系统需支持每一层的统计信息展示,包括代码集、代码表的统计。系统应支持批量导入代码集、批量导出代码集、支持对目录/表/代码项的新增、编辑、删除;更新变化表至元数据。1.3.2.2.5代码映射关系管理:需支持代码映射关系管理,分别记录原代码目录、原代码表表名、原代码表数量、映射表表名、代码映射关系数、预警映射关系数,应支持编辑、删除操作。需支持新增代码表映射关系、立即检测代码关系、导出文件等功能。1.3.2.2.6数据集监测日志管理:应支持数据集变更日志统计,分别记录数据集和代
22、码集数据项变更的情况,展示全量数据中心元数据正向/反向同步元数据表的更新记录,包括数据集元数据和代码集元数据。方便追踪数据中心元数据的变化情况。1.3.2.2.7代码集监测日志管理:应支持代码集变更日志统计,分别记录数据集和代码集数据项变更的情况,展示全量数据中心元数据正向/反向同步元数据表的更新记录,包括数据集元数据和代码集元数据。方便追踪数据中心元数据的变化情况。1.3.2.2.8UC矩阵预览:系统需支持UC矩阵预览(包括数据表和字段级的预览),原始层的表结合映射关系通过系统自动识别表的使用者,快速生成UC矩阵。1.3.2.2.9映射关系管理:需实现数据之间的字段级的映射关系管理。1.3.
23、2.2.9.1原始层映射关系:系统需支持实时读取数据清洗与整合平台作业数据表解析,需提供新增映射关系,查看/编辑映射关系详情,查看映射关系,删除映射关系。1.3.2.2.9.2主题层/统计层映射关系:系统需支持实时读取数据清洗与整合平台作业数据表解析,需提供新增映射关系,查看/编辑映射关系详情,在线配置映射关系详情,预览映射关系,删除映射关系。1.3.2.2.9.3应用层映射关系:系统需支持实时读取数据清洗与整合平台作业解析视图,需提供新增映射关系,查看/编辑映射关系详情,在线配置映射关系详情,预览映射关系,删除映射关系。1.3.2.2.9.4提供全量数据中心元数据管理功能演示,应至少包含数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XX 学院 数据 治理 平台 建设项目 采购 需求
![提示](https://www.desk33.com/images/bang_tan.gif)
链接地址:https://www.desk33.com/p-486078.html