1.1 总体建设方案
1.1.1 中心总体定位
区级大数据资源平台建设的核心是汇聚全区各类公共数据,建立面向政务顾问、经济发展、城市管理、社会公共服务与乡村振兴的数据资源库与数据服务。为智慧城市提供全面、高效、安全、智能的数据管理与应用支撑,是智慧城市建设总体战略与落地规划中的重要组成部分。
1.1.2 总体解决方案
1.1.2.1 平台总体蓝图
针对区级大数据资源平台的建设,我们将基于当前主流的大数据技术框架为XX区搭建一个大数据管理与应用平台。利用数据平台的数据采集功能,将XX区各级政府单位的政务数据、城市管理相关的监控视频等物联数据、企业事业单位数据,互联网等社据汇聚起来,形成统一的XX区级大数据资源池。
之后,在利用平台的数据治理与建模开发能力,将采集到的数据有效地进行分类整理与融合,构建诸如综合人口库、产业经济主题库、旅游数据库、菜园花鸟数据库,乡村产业经济振兴库等数据应用服务,并利用统一门户将相关数据应用对外开放,向XX区各级单位、企事业单位等用户提供数据服务,由此构建XX区的数据资源中心,实现对全区政务等数据的集中汇聚、统一管理与共享利用,为全区政务处理与经济发展提供数据支撑。具体,本次项目的解决方案蓝图如下:
1.1.2.2 平台总体架构
区级大数据资源平台平台基于基础设施(网络&技术&存储)、技术标准体系规范及信息安全保障体系建设数据支撑底座、数据交换、数据资源中心(基础及融合数据库)、数据整理治理、数据服务、数据分析、数据共享应用及数据资源门户模块,并实现与S市大数据资源平台的共享与交换。
1.1.2.3 平台架构关系
架构关系说明:
ü 基于数据治理平台,搭建数据治理产线:各个委办局梳理资源,形成目录清单并制定数据治理相关规范,基于目录及规范搭建数据治理产线;
ü 数据共享交换平台:数据治理/服务/分析平台设置数据归集调度任务,通过数据源采集数据到数据湖(数据资源中心);
ü 数据源:各个委办设置前置机放置源数据;
ü 数据资源中心:对通过数据共享交换平台采集的数据进行存储;
ü 数据基础支撑平台:数据治理/服务/分析平台通过数据基础支撑平台进行数据读取、处理与存储;
ü 数据资源门户:通过治理后资源在门户进行展示,并为各个委办提供浏览及申请入口,同时经过申请的数据如果需要清洗/转换操作,则数据治理平台将根据治理规范及产线进行数据的加工处理,并将处理后的有效数据同步给门户;
ü 数据共享交换平台:用户经过门户申请的数据,将通过数据共享交换平台进行数据的共享。
ü 统一维护平台及数据安全管理将为整个数字区级大数据资源平台的平台建设保驾护航。
1.1.3 项目实施方案
在本项目中,首先需要建设一套大数据资源管理与应用平台,并基于大数据资源管理与应用平台,利用平台中的各类功能,通过汇聚数据、数据治理、数据开发与数据服务等手段,逐步建设各类区级数据资源(包括:数据湖、基础库、主题库、主题库等)。
具体,项目的总体建设实施方案如下:
2 资源平台建设方案
2.1 平台总体架构
区级大数据资源平台的总体架构由支撑体系(标准规范支撑体系、管理运行维护支撑体系、安全支撑体系)、网络系统、信息资源平台软硬件系统环境、平台应用系统(数据支撑底座、数据交换子平台、数据整理治理子平台、数据资源门户),以及数据资源中心(数据湖、基础库、主题库、专题库)组成。具体平台架构如下:
2.2 数据交换子平台建设
建设全区统一的数据数据交换子平台,形成公共数据归集、交换、共享的核心枢纽;打通全区各单位之间数据资源共享通道,实现双向数据互通。
2.2.1 建设方案概述
通过本项目数据共享交换平台建设,构建XX区数据共享交换体系,推动政务数据的跨层级、跨地域、跨系统、跨部门、跨业务的共享利用,为公共基础库、业务主题库,提供底层数据支撑。
XX区数据交换系统基于电子政务云搭建,为全区数据管理部门提供云端的数据共享交换服务的统一平台,可实现部门前置节点与政务云中心节点间、部门与部门间稳定可靠的双向信息传递。
2.2.1.1 架构设计
鉴于数据源应用的异构平台、异构系统接入的复杂性,数据共享交换平台建设应统一技术架构、统一接入标准规范(包括技术规范、接入规范、管理规范、运行规范等),同时既要充分考虑系统的安全性、可扩展性,又要充分考虑数据交换的实时性、可靠性和高效性,实现各系统数据的采集、同步、筛选比对等业务功能目标。
因此,本次数据共享交换平台建设将充分利用信息化手段,采用当前主流的技术标准,主要包括数据库技术、数据集成技术、消息中间件、SOA体系架构等技术,采用组件化和松耦合的设计思路,实现统一平台架构、统一技术标准、统一数据接口。数据交换子平台建设围绕数据资源的采集交换、数据传输、交换监控流程进行,以保证平台功能、服务更加贴近实际业务应用需要。
具体,本次区级大数据资源平台中的数据交换子平台的总体业务与逻辑架构设计如下:
利用数据交换平台与各政务部门进行互联,通过数据传输系统各委办的数据资源汇集到数据中心;对汇集到数据中心中的数据进行统一的加工、处理;将经过数据治理后的数据中心中的数据交换到各类基础信息库中,服务管理系统将各类基础信息库中的数据进行服务封装和服务发布,提供给各委办或决策分析等系统使用。
总之,通过数据交换平台的建设与实施,将为XX区构建完善的数据共享交换体系,为本项目总体体系建设提供数据共享交换服务支撑。
2.2.2 数据交换配置
获取信息资源中定义的信息资源更新频率,自动实现采集、可以配置全量或者增量采集方式,可以配置数据提供部门在数据中心部门前置库的存储位置等。
能够提供对于采集周期,时间的采集策略配置、接口配置采集任务配置功能。
对于应用数据采集,需要管理的关键业务点有采集点、数据传输。主要性能指标包括:在采样周期内成功取得文件的数量、采集数据间隔时间、采集文件大小、进程状态、文件连续性、采集状态、传输速率等。
获取信息资源中定义的信息资源更新频率,自动实现采集、可以配置全量或者增量采集方式,可以配置数据提供部门在数据中心部门前置库的存储位置等。
2.2.3 数据交换前置
(1)灵活的数据交换需求
系统需满足各部门的数据资源交换需求,提供自主、可控的数据交换服务:
在供需关系匹配模式上,一对一、一对多、多对一、多对多的数据交换匹配模式;
在交换方向上,提供支持单向、双向的数据交换方式;
在数据库数据抽取方面,支持全量抽取和增量数据抽取,增量抽取支持时间戳、触发器以及基于日志分析的数据抽取方式;
在运行模式上,支持自动运行和手工控制运行方式;
在交换系统与部门对接的应用系统交互模式上,支持主动交换和被动交换;
在交换时效性上,支持实时交换、定时交换、周期性交换等模式;
(2)异构平台兼容性需求
作为基础性软件设施,数据交换系统接入部门众多,各个相关单位的系统运行环境各异,因此,交换系统需要支持各种异构的平台环境,包括:系统平台、数据库环境等。交换系统应支持运行在各种主流的操作系统平台上,包括:Linux、Windows、Unix等各种操作系统,支持物理机部署和虚拟机部署,针对不同数据存储的系统不同,应支持各种常见的数据库管理系统,并能够对国产数据库系统提供良好的兼容能力。
2.2.4 数据共享服务
数据资源只有得到有效的整合、开发、应用,才能发挥相应的价值。通过平台建设,通过数据资源的服务化处理,才能更好的开展面向领导量化决策、社会民生服务等领域相关业务应用,提供更加及时有效的数据资源共享应用服务。
因此在本项目中将建设数据服务子平台,通过统一的数据服务平台,将平台中的各类数据资源封装为标准接口并以服务的方式对外共享,实现对数据资源的统一访问、使用申请、共享调度,管理与监控。通过统一的数据服务平台,实现对服务资源的统一访问、调度、管理与监控。
数据服务管理平台以服务总线为支撑,构建高效、稳定的统一应用整合、数据服务体系,一方面可以将现有业务系统功能接入统一平台作为共享服务对外提供,同时也可以将共享的数据资源通过标准服务方式对外共享,同时提供共享安全保护策略。
2.2.4.1 数据服务注册
平台提供数据服务管理功能,将清洗后的数据以及场景化分析后的数据注册为数据服务,统一进行管理与对外共享。
平台提供接入数据服务的管理,包括服务的注册、发现及管理。当数据服务封装成服务并完成注册后,这个服务即能够被相关用户发现、理解并调用。
同时,平台还可以对所有数据服务的调用与数据共享行为进行统一的管理和审计。
2.2.4.2 数据服务申请
对于平台中的数据共享与应用服务,用户需要经过申请并通过审批后才可以使用,而数据服务申请就对所有数据服务的申请行为进行管理与处理。通过数据服务的申请授权,能够开放指定数据对应的权限给申请者,达到数据安全共享的目的。
2.2.4.2.1 服务申请
主要包括数据使用对象申请数据等级、申请内容、申请时效、申请目的等。
2.2.4.2.2 申请审核
政务部门接受其他政务部门在共享网站上的资源申请,进行审核操作。数据中心可以对申请审核进行督办,政务部门可以进行督办反馈。
2.2.4.2.3 申请查看
可以查看本部门申请其他部门资源情况,申请资源名称、资源提供部门、申请时间、主要用途、申请状态和资源数据量等,可以撤销资源申请。
可以查看本部门的各类资源被其他部门申请情况,资源名称、申请用户、申请部门、申请时间、主要用途、申请状态和资源数据量、申请次数等。
可以对部门申请审核进行督办,政务部门可以针对该督办进行反馈。
2.2.4.2.4 申请撤销
申请撤销是指对申请资源的撤销一旦申请撤销,该资源的订阅也被同时撤销。
如发现需求部门存在违规使用申请通过的数据资源,数源部门可以提出共享撤销,并报送数据管理部门审核,审核通过后,资源申请立即撤销,同步停止数据交换、接口等数据共享。
如遇到由于本部门业务变化而等原因情况,数源部门可以提出资源共享撤销,并报送数据管理部门审核,审核通过之后,通知数据需求部门,并在公共数据资源共享管理办法规定的时间触发资源申请撤销,通知数据交换、接口等数据共享。
2.2.4.3 数据服务监控
数据共享与应用服务面向众多业务部门,涉及面广,范围大、数据量大,为了确保数据服务的有序、稳定运行,将提供易用、直观的服务监控功能支持,提升数据资源共享与应用的效率。
数据服务管理子平台提供数据服务监控功能,对数据服务的使用情况进行全面的监控,监控各个服务申请使用的状态、数据共享的性能等,保证数据共享的效率和可靠性。统一的数据服务监控可实现对数据共享的统一调度和监控,为数据共享服务实现数据安全、完整、可用、可核查并且可靠稳定的运行。
2.2.5 数据共享接口
将清洗后的数据以及场景化分析后的数据注册到服务管理系统中,统一进行对外共享。并且对共享行为进行统一管理和审计。
平台提供应用/数据服务的封装能力,支持将清洗后的数据以及场景化分析后的数据服务封装为标准的服务接口,供外部系统调用,实现数据共享。
数据服务的封装一般情况下应该采用基于Web服务的方式进行封装,但同时也支持其他接口协议的封装,如HTTP、JMS等方式。
平台可以支持关系型数据库(Mysql、Oracle)等多种数据源的基础数据,可以针对不同的数据源迅速开发基础信息共享接口。可以提供API接口、文件以及库表等多种当时的服务接口。