摘自信通院《大数据安全白皮书》

        大数据安全是一个跨领域跨学科的综合性问题,可以从法律、经济、技术等多个角度进行研究。本报告以技术作为切入点,梳理分析当前大数据的安全需求和涉及的技术,提出大数据安全技术总体视图,如图 1 所示。

        在绘制大数据安全技术总体视图的过程中,我们参考了 NIST 等国内外关于大数据技术参考架构的研究成果。考虑到大数据平台为上层应用系统提供存储和计算资源,是对数据进行采集、存储、计算、分析与展示等处理的工具和场所,因此,我们以大数据平台为基本出发点,形成了大数据安全总体视图。

安全架构方案 安全架构功能视图_安全架构方案

1. 大数据平台安全

        大数据平台安全是对大数据平台传输、存储、运算等资源和功能的安全保障,包括传输交换安全、存储安全、计算安全、平台管理安全以及基础设施安全。

        传输交换安全是指保障与外部系统交换数据过程的安全可控,需要采用接口鉴权等机制,对外部系统的合法性进行验证,采用通道加密等手段保障传输过程的机密性和完整性。

        存储安全是指对平台中的数据设置备份与恢复机制,并采用数据访问控制机制来防止数据的越权访问。

        计算组件应提供相应的身份认证和访问控制机制,确保只有合法的用户或应用程序才能发起数据处理请求。

        平台管理安全包括平台组件的安全配置、资源安全调度、补丁管理、安全审计等内容。此外,平台软硬件基础设施的物理安全、网络安全、虚拟化安全等是大数据平台安全运行的基础。

2. 数据安全

        数据安全防护是指平台为支撑数据流动安全所提供的安全功能,包括数据分类分级、元数据管理、质量管理、数据加密、数据隔离、防泄露、追踪溯源、数据销毁等内容。

        大数据促使数据生命周期由传统的单链条逐渐演变成为复杂多链条形态,增加了共享、交易等环节,且数据应用场景和参与角色愈加多样化,在复杂的应用环境下,保证国家重要数据、企业机密数据以及用户个人隐私数据等敏感数据不发生外泄,是数据安全的首要需求。

        海量多源数据在大数据平台汇聚,一个数据资源池同时服务于多个数据提供者和数据使用者,强化数据隔离和访问控制,实现数据“可用不可见” ,是大数据环境下数据安全的新需求。

        利用大数据技术对海量数据进行挖掘分析所得结果可能包含涉及国家安全、经济运行、社会治理等敏感信息,需要对分析结果的共享和披露加强安全管理。

3. 隐私保护

        本报告所提的隐私保护是指利用去标识化、匿名化、密文计算等技术保障个人数据在平台上处理、流转过程中不泄露个人隐私或个人不愿被外界知道的信息。隐私保护是建立在数据安全防护基础之上的保障个人隐私权的更深层次安全要求。

                然而,我们也意识到大数据时代的隐私保护不再是狭隘地保护个人隐私权,而是在个人信息收集、使用过程中保障数据主体的个人信息自决权利。实际上,个人信息保护已经成为一个涵盖产品设计、业务运营、安全防护等在内的体系化工程,不是一个单纯的技术问题。