数据采集体系

产品及服务:

共享交换系统

共享交换系统是企业级批量数据处理总线产品。可以快速稳定的实现异地、异构数据库的数交换和整合,确保参建部门之间,参建部门与交换系统之间数据交换过程中的安全,并提供交换审计的管理,对交换流程、交换节点、交换量等进行统一配置和监控等。

 

治理平台

社会治理平台是,用于对政府机构的各种数据源进行标准化采集与管理,并对提供数据源的采集队伍进行全方位督查与管理的平台型产品。云采利用移动系统与GPS相结合,采用大数据分析技术、GIS分析技术、公安部数字身份认证等技术,对政府机构所采集的各类事件、人口、房屋、法人、地址、地理空间等数据进行汇总统计、建立全业务关联、智能分拨,全方位构建数据采集与队伍管理系统。

 

数据填报系统

智能填报功能主要为系统终端用户,或者说是使用系统的业务人员,提供一个纯HTML页面、界面友好、简单易用的填报表设计、发布、管理与填报数据汇总分析的平台。用户不再需要使用专门的报表设计器来设计填报表模板、设计报表样式与填报属性、在模板上设置填报数据向数据库存储的更新属性、发布报表至应用系统平台、抽取 填报数据进行统计分析等等的一系列复杂且具有开发性质的制表过程。

 

众包采集系统

众包采集系统,将通过发展大众建立众包数据采集队伍,采用移动设备进行众包采集,将数据进行集中管理,保障数据上传的及时、高效、更新速度快。同时提供数据的及时更新汇总与输出,对数据进行过滤、筛选、校验、整理等,对数据进行质量把控与管理,为小微企业等众多数据的需求者(称为“金主”)提供数据支持。

 

深网爬虫系统

爬虫系统的功能是下载网页数据,为搜索引擎系统提供数据来源。很多大型的网络搜索引擎系统都被称为基于 Web数据采集的搜索引擎系统,比如 Google、Baidu。由此可见网络爬虫系统在搜索引擎中的重要性。网页中除了包含供用户阅读的文字信息外,还包含一些超链接信息。网络爬虫系统正是通过网页中的超连接信息不断获得网络上的其它网页。正是因为这种采集过程像一个爬虫或者蜘蛛在网络上漫游,所以它才被称为网络爬虫系统或者网络蜘蛛系统,在英文中称为Spider或者Crawler。

数据治理体系

 

数据资源体系:

  1. 数据监管保护系统:

数据监管保护系统是对部门、用户、角色的不同属性的用户,在数据库级、表级、字段级进行访问控制。对数据采集、数据抽取、数据清洗、数据融合以及数据服务支撑等过程进行监控管理。根据政务数据敏感程度、使用对象、数据用途不同等对数据进行数据脱敏,确保政务数据安全。

  1. 数据集成管理系统

数据比对系统是根据预定义的数据比对和校验规则,对数据进行差异分析和异常分析,对于分析的结果,反向推送给数据提供部门,进一步提升数据质量。同时可以配置为一个自动化的流程,定义比对的时间、比对的业务规则进行数据比对工作。本系统提供数据比对配置,管理和调度功能,通过可视化配置比对任务,并进行任务调度,系统根据比对规则,进行数据比对,并找出数据差异,提供差异数据的导出,同时统计数据匹配情况。

  1. 数据集成管理系统

数据集成管理系统作为数据融合与数据治理体系的一个环节,负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

  1. 数据质量工单系统

为了及时的发现问题数据,包括残缺数据、错误数据、重复数据等,同时,能够及时来修复这些数据,因此,对于城市政务信息资源库的数据需要提供数据质量提升服务,保障发现问题数据的及时性,以及完善快速处理问题数据流程。具体通过数据质量工单系统来实现数据质量提升服务。对数据质量进行实时监测,结合数据稽查,进一步建立全面的、完整的数据质量提升规则。

数据标准治理系统:

数据标准治理系统主要针对核心数据、系统间交互数据定义的共有约束。数据标准治理系统包括数据标准、数据元、主题分类、制定组织、用途描述等信息。同时数据标准治理系统还支持对标准相关信息进行增、删、改、版本管理、审批、发布等服务功能,确保标准及时满足业务需要及规范化管理。

数据服务支撑系统:

数据服务支撑系统是从信息资源库的人口、法人、房屋三大基础库提取数据,并进行相关的数据处理与接口封装,为应用支撑平台提供数据支撑服务,为满足城市级(省级)各个业务部门在应用支撑平台上的各类应用建设的数据需求。数据服务支撑系统的建设主要内容包括:数据服务门户、数据管理与接口管理,以及后台管理几大模块。

数据质量治理系统:

数据质量治理系统是对数据质量进行实时监测,结合数据稽查,进一步建立全面的、完整的数据质量监测规则。能从宏观查看总体的处理流程,也能从微观了解到每一个数据表、每一个数据字段的加工过程。通过数据质量评价模型,对每一个清洗加工后的政务基础信息实体对象进行评级。如对每一个人口实体对象的数据质量通过其得分进行评价,直观了解数据的质量情况。对数据进行打标签,如人口数据,按照居住、工作、学习、办事、落户等方面进行打便签,能够精确到每一类人群、每一个个体。在建立起数据质量监测服务体系之后,要求定期根据数据质量监测的成果,形成相应的定期监测报告。

数据质量评估系统:

数据质量评估系统,即大数据探索稽查软件。功能包括数据概况统计、数据列分析、数据关联探索、质量评估等,并支持超大数据集。实现数据概况的统计分析,包括:Schema概况统计、表概况统计、敏感信息探查、主外键关联探索。

信息资源目录管理系统:

信息资源目录管理系统,具备对元数据的采集、存储、维护、更新、安全等进行管理。主要功能模块包括元数据模型管理、元数据采集管理、元数据维护管理、元数据分析、系统管理等功能。

主数据管理系统:

数据的管理可以将政务基础信息的核心数据进行有效的资产管理,促进数据标准与数据质量体系的建立,进而支撑政府决策及政府公共服务主动化、精准化。

数据开放系统:

数据开放平台具备从数据编目、数据采集、数据清洗、数据质量、数据脱敏、数据开放全过程管理功能,并在实践中积累了丰富的管理规范和技术底蕴,专注于提升数据质量和数据价值,保障数据安全。

 

政务数据融合治理解决方案

一、方案背景

1.1   建设背景

智慧城市是以信息和通信技术为支撑,通过透明、充分的信息获取,广泛、安全的信息传递,有效、科学的信息利用,提高城市运行和管理效率,改善城市公共服务水平,是以智慧技术、智慧产业、智慧人文、智慧民生、智慧管理、智慧生活等为重要内容的城市发展新模式。大数据是指所涉及的海量数据信息,可以通过对数据进行存储、清洗、索引、分析,把信息转化为对现在的判断和将来的预测。大数据技术不仅能够提高人们利用数据的效率,而且能够实现数据的再利用和重复利用,进而大大降低交易成本,提升人们开发自我潜能的空间。

随着全社会信息量爆炸式增长,数量巨大、来源分散、格式多样的大数据对政府服务和监管能力提出了新的挑战,智慧城市大数据面临着诸多问题。首先,全社会信息量爆炸式增长,城市发展积累了很多数据,但没有深入应用;其次,数据虽多,但大都分散在各个政府部门,没有整合共享。与此同时,大数据为政府治理能力的提升也带来了发展机遇。首先,在政府治理领域,通过让海量、动态、多样的数据有效集成为有价值的信息资源,推动政府转变管理理念和治理模式,进而加快治理体系和治理能力现代化。其次,推动政府治理决策精细化和科学化,降低政府治理偏差概率,推动政府治理提高效率,节约成本。

1.2 现状与分析

虽然各个职能部门在社会建设领域开展了很多卓有成效的工作,但是,由于各部门之间的信息交换的渠道、机制不通畅,使得各部门在日常工作中获得的信息都只能片面的,静态的反映社会状况,一定程度上形成了“信息孤岛”的问题,影响了党委、政府服务管理工作的针对性和科学性。因此,为了打通各部门的“信息壁垒”,形成整体合力,打造反映包括人口、法人、房屋、城市部件等各类社会信息的“蓄水池”,不仅需要各级政府、各相关职能部门按照基础信息资源库的建设要求,准确、及时地提供办理业务产生的信息,而且还需要对来源于各个部门不同制式的数据进行规范处理,从而最终共同构建起权威的信息数据库,并使这个“蓄水池”既保持“水量充足”,又做到“水质优良”,发挥好信息数据对服务管理的支撑作用。

 

二、方案建设内容

2.1   建设目标

由于城市的“基础信息资源库”需要从全市相互独立的多个业务系统中抽取数据,这些业务系统并没有经过顶层设计和统筹规划,他们之间的数据之间必然存在不完整、重复、错误、不一致的问题。为解决上述数据问题,一方面需要在把这些业务系统数据加载到基础资源库之前对数据进行全面的质量稽查、修复、关联和匹配融合;另一方面需要把经过修复、融合后的数据和社区网格管理员采集的人口、法人数据进行关联比对,最终形成全市统一的实有人口、法人(机构)、房屋(城市部件)数据,为覆盖市、区、街道、社区四级网络的综合信息系统提供支撑,为社会建设、城市管理和公共服务提供信息资源保障。尤其对基础资源库的数据梳理要形成数据质量评估报告。

在数据梳理完成的“基础信息资源库”上,可以对城市的人口进行数据上的普查,通过对数据的分析得出全市常住人口、家庭户人口、性别构成等各项人口普查指标。与传统的人口普查方法相比,从数据上进行人口普查,不仅简单快捷,没有时间限制,还能节省大量人力物力成本。

2.2   建设内容

由于城市的“基础信息资源库”需要从全市相互独立的多个业务系统中抽取数据,这些业务系统并没有经过顶层设计和统筹规划,他们之间的数据之间必然存在不标准、不完整、重复、错误、不一致的问题。为解决上述数据问题,需要根据确立的“基础信息资源库”的数据标准,让数据收集和交换的过程有章可循,在每个局点业务系统数据加载到公共基础资源库之前对数据进行全面的质量稽查、标准化、修复和匹配融合,最终形成全市统一的实有人口、法人(机构)、房屋(城市部件)数据,并对这些数据间的关系进行挖掘,形成城市社会关系大图,为覆盖市、区、街道、社区四级网络的城市综合信息系统提供支撑,为社会建设、城市管理和公共服务提供信息资源保障。为实现该目标,大数据城市数据治理方案的内容包括数据治理体系建设,包括数据质量评估、数据标准管理、政府数据仓库模型、数据比对融合、数据质量清洗、数据质量提升、数据安全管理、数据资产管理等方面。

 

三、解决方案价值

随着信息技术与经济社会的交汇融合,虽然各政府部门中存储着海量的政务数据,但是各部门间的数据都互不共享,没有进行统一的管理。如何行之有效地将这些数据应用起来,成为了各政府部门的共同难题。

通过对城市大数据数据治理就能很好的解决数据应用的难题。方案结合了先进的大数据技术和传统的数据仓库技术,对广泛分布在各个政府部门触角的海量零碎的政务数据资源进行收集、整理、清洗、转换、融合、分析和挖掘,打破各部门间的数据壁垒,实现数据共享,将各类数据充分的应用起来。为政府管理解决了一些实际性的问题:

 

                1. 融合分析各部门数据,为领导决策提供数据支撑;

                2. 分析挖掘各部门数据,提供各类市民服务;

                3. 融合共享各部门数据,建立智慧政务数据服务平台;

                4. 按地域块化数据,实现数据的按需安全分发。

 

 

城市数据大脑解决方案

Address standardization solution

一、方案背景

1.1   建设背景

 总体目标以实际需求为导向,搭建城市大脑大数据平台,充分挖掘与发挥数据应用价值,构建数据集成、数据共享、数据管理、数据决策的综合管理服务体系,全面支撑城市政务数据协同服务、城区管理协同服务、惠民数据协同服务和兴业数据协同服务。为城市领导决策和减轻基层人员工作量提供坚实的数据支持。通过城市大脑大数据建设和应用,实现,综合决策科学化。将大数据作为支撑管理科学决策的重要手段,实现“用数据决策”。利用大数据支撑综合研判、政策措施制定、风险预测预警、重点工作会商评估,提高综合治理科学化水平,提升经济发展与宏观调控的能力。

政府服务精准化。充分运用大数据提高政府监管能力,助力简政放权,健全事前事中事后监管机制,实现“用数据管理”。利用大数据支撑法治、信用、行政服务等监管手段,提高监管的主动性、准确性和有效性。

公共服务便民化。运用大数据创新政府服务理念和服务方式,实现“用数据服务”。聚焦社会民生、生态环境、城区建设、商贸金融等领域,重点推进一批广受关注的数据资源向社会开放。

1.2 现状与分析

目前,我过各地方政府有相同的问题,人口老龄化现象严重,流动人口众多,交通拥挤、停车困难、场地紧张等问题突出,有效协同性地解决这些深层次的治理难题,大数据应用将发挥极大的作用。由于大数据应用从整体视角出发基于协同联动,精确性的揭示诸多诱导因数,对于在人口、商业、养老、交通等方面大数据应用有着巨大潜在效应。充分利用城市大脑大数据平台,破解城区治理难题、建设城区生态体系、解决民生关切难题、保持经济稳定增长已经势在必行。

 

二、方案建设内容

2.1   建设目标

 汇聚政府、社会、互联网、城市感知等数据,建立城市大脑大数据平台,利用多元异构数据融合的先进技术思想,对数据进行统计分析,深度挖掘,洞察其潜在的价值,带来多样化的大数据服务,让“软件定义数据”,通过技术的革新带动政府服务的创新,为公共安全、综合治理、行政执法、市场监管、公共信用、经济运行监测预警、统计调查、社会保障、医疗健康、教育文化、交通运行、旅游服务等城市治理领域的大数据应用提供大数据服务,为实现社会治理精细化、经济运行科学化、民生服务智能化等政府科学决策提供有力的数据支撑。

2.2   建设内容

智慧城市大脑大数据平台,是面向智慧城市应用垂直业务之上的集成大者,将极大促合各部门各领域业务协同和数据整合,形成“城区运行全景图”,实现对城区内社会经济、公共安全、生态环境、交通、政务建设等重点领域运行状况综合展示。城市大脑大数据平台将以数据融合为核心的共享融合、以业务为对象的管理协同、以城区事件态势为重点的可视化管理、以融合通讯为工具手段的协同指挥,通过数据关联融合形成城区关键体征运行监控管理,全面呈现城区运行综合态势,感知城区运行风险和发展趋势,便于领导及各综合部门调整相应处置方法和政策。

 

三、解决方案价值

有利于领导全面、及时、准确掌握城市经济社会发展动态,并科学决策、精准指挥。是政府协同整合数据资源的有力抓手,过去,往往缺乏对大数据应用的推动核心动力,政府数据整合停留于缺乏应用支撑的数据层面整合,而常常不能达到效果。通过城市大脑大数据平台的建设,可以从整体视角出发,在大数据平台支撑下,形成政府各级部门数据贯通迫切性。通过大数据平台系统集成了城市碎片化的数据,且经过清洗,在经过口径分析基础上搭建起科学的数据模型,及时、准确、直观进行展示城市经济社会发展动态,并辅助领导进行决策。同时,还提供垮部门智慧调度的支持。

有利于部门精准施政、高效施政。一是通过大数据和模型分析,通过可视化图形直观显示,科学分析部门施政面临的各种问题,辅助部门决策,为部门精准施政提供支持。二是打通各部门、各个业务系统的相互联系,使部门之间沟通协作更加方便和便捷,提高部门施政的效率。

有利于部门在重大事件中的工作联动。城市大脑大数据平台实时集成各个部门的业务数据,有利于提高部门工作联动的效率,特别是在重大事件处理上,提升整体协调、联动指挥的能力。

有利于政府内部实施精准的绩效评估。城市大脑大数据平台对接部门业务系统,集成部门行政行为数据,有利于提高部门绩效评价的及时性和科学性。

有利于提升政府服务的水平。基于政府大数据中心的数据资源,更加及时、准确的发布城市重大事件信息、城市重要发展事项信息等信息,实现更大范围的政务公开,提升政府面向公众的服务水平。