数据的脱敏与加密在数据安全领域极为重要,也是大数据平台、数据中台建设中不可缺少的一环,我将以数据脱敏与数据加密的特征以及区别、方法论来进行研究学习。

一、数据脱敏与数据加密是什么?

数据脱敏与数据加密是两种截然不同的技术,也适用于不同的目的。数据脱敏技术主要是为了兼顾数据安全与数据使用,采用专业的数据脱敏算法;而数据加密则是通过对数据进行编码来保护数据,获取实际值的唯一方法是使用解密密钥解码数据。所以说,数据加密是可逆的,数据脱敏是不可逆的。


二、数据加密与数据脱敏的优劣以及实施方法?

1.数据加密:

优点:数据加密的优点就在于它的可逆性,敏感数据的实际值被转为垃圾值,可以通过解密还原出实际值;

缺点:

1)解密密钥存储位置、如何存储密钥以及访问权限等工作都会给整个安全工作增加成本、故障点、复杂性;

2)加密不能完全从技术上保证数据的安全,任何有权限访问用户数据的人员,均有可能导致数据泄露;

3)没有数据访问权限的人员,也可能存在对数据进行分析挖掘的需求,数据的访问约束限制充分挖掘数据价值的 范围;

实施方法:例如DES、MD5等加密函数,具体感兴趣的可以去网上搜一下,可以做一些加密数据的测试。

2.数据脱敏:

优点:数据脱敏能够在更好的保证数据的隐私性的同时保证数据的可用性

缺点:敏感数据的实际值被转换成虚构的、但看起来逼真的值,实际值被永久改变且无法恢复,过程是不可逆的

实施方法:脱敏又分为静态脱敏和动态脱敏;

1)静态脱敏:对数据的搬移并仿真替换,按照用户指定或预定义的敏感数据特征,对数据进行自动识别,发现敏感数据,通过对数据的抽取,进行遮蔽、变形、替换等脱敏技术后下发给下游环节(供取用读写的数据库或目标文件中),脱敏后的数据与生产环境相隔离,做到既满足业务需求又保障生产数据库的安全;

2)动态脱敏:在访问敏感数据的同时实时进行脱敏处理,可以为不同角色、不同权限、不同数据类型执行不同的脱敏方案,从而确保返回的数据可用而安全;

动态脱敏会对数据进行多次脱敏,通过匹配用户IP或MAC地址等脱敏条件,根据用户权限,基于SQL语句解析技术,将包含敏感字段的查询语句进行改写,对敏感字段采用函数运算的方式,让数据库自行返回改写后的不包含敏感信息的数据。

扩展:数据动态脱敏经过多次迭代发展,目前也有混合模式动态脱敏,集结果集改写和sql语句改写,仍需要进一步学习研究,技术进步永远是数据安全进步的尺度。