Menu

1.产品简介

“聚变2017”数据脱敏系统是北京数聚世界公司开发的一款高性能的数据脱敏产品,采用专门算法对敏感数据进行脱敏变换,以保护用户隐私信息,为数据的安全使用提供了基础保障。该系统实现了敏感数据识别功能,能提供扩展的脱敏策略、灵活的任务管理和高效的脱敏能力,可帮助银行、证券、保险等金融机构快速实施敏感数据脱敏处理。 “聚变2017”数据脱敏系统的脱敏目标为:保证数据经过变形、替换、随机化、限制以及加密等变换脱敏后,隐蔽用户的个人身份、账号、地址等隐私信息;同时保证数据的有效性和可用性,使脱敏后的数据能够安全的应用于测试、开发、仿真、分析、交易流通和第三方使用环境中。

2.需求背景

在金融机构的各类后台数据中,储存着大量的敏感信息,无论是从商业惯例还是数据安全角度,这些敏感信息都应得到有效的保护,一旦发生信息泄密行为,不仅会造成重大的财产损失,也会对机构的名誉造成严重影响并造成巨大损失。据国外调查结构发布的数据,因每次数据泄漏给企业带来的损失平均超过720万美金。尤其在最近几年,国内外都不乏安全事件曝光和披露。如2012年,美国金融界爆出约4000万张信用卡资料外泄,对众多客户的直接利益造成了损害;2013年5月,华盛顿州法院行政办公室网站系统遭到了黑客入侵,导致高达16万个社会保障号泄露;2013年4月,英国离岸金融业200多万份邮件等文件泄密,全球数千名匿名财富持有者的身份首次遭曝光;2014年初,韩国国民银行和农协银行等多家大型金融机构发生金融信息泄露事件,1500万客户的1.04亿条个人信息遭泄露,内容涉及手机号码、个人地址、信用卡账号乃至部分银行交易记录等。目前,在发生较多的信息泄漏和诈骗、攻击等安全事件后,金融、医疗等行业都提出了要加强数据安全保护,如我国的银监会《银行金融机构信息系统风险管理指引》等明确要求国内的金融机构规避信息风险,对客户等资产安全,敏感信息提供完善的保护,需要对客户资料信息等敏感信息进行脱敏、变形、实现有效保护。

“聚变2017”数据脱敏系统是北京数聚世界公司开发的一款高性能的数据脱敏产品,采用专门算法对敏感数据进行脱敏变换,以保护用户隐私信息,为数据的安全使用提供了基础保障。该系统实现了敏感数据识别功能,能提供扩展的脱敏策略、灵活的任务管理和高效的脱敏能力,可帮助银行、证券、保险等金融机构快速实施敏感数据脱敏处理。 “聚变2017”数据脱敏系统的脱敏目标为:保证数据经过变形、替换、随机化、限制以及加密等变换脱敏后,隐蔽用户的个人身份、账号、地址等隐私信息;同时保证数据的有效性和可用性,使脱敏后的数据能够安全的应用于测试、开发、仿真、分析、交易流通和第三方使用环境中。

2.1需要安全使用隐私数据

在今天的大数据时代,我们需要使用海量数据来支撑业务和辅助决策,这些数据在创造着巨大的商业价值,同时用户的隐私数据如身份信息、银行帐户信息、电话等重要信息在金融机构的各个业务系统中都存在,而在实际应用中,处于宣传的需求、出于统计分析的需求、出于综合关联分析的需求,在系统测试、外包开发、数据分析、业务培训等各个环节都可能调用业务系统中的数据。因此,很多信息系统能访问用户隐私数据,也可能存在多个渠道能够导出用户隐私数据,甚至应用系统“被迫必须”向测试系统提供一定的用户隐私信息,在业务分析、开发测试、审计监管等使用过程中如何保证生产数据安全已经成为一个亟待解决的问题。

2.2数据安全相关政策与法律法规

各国家和组织都制定了相关的法案法规,要求解决生产数据在非安全环境中使用的数据遮蔽脱敏问题,以对商业信息、企业信息和个人隐私信息进行有效保护。国际法规有PCI DSS - 支付卡行业,FISMA - 联邦信息管理法案,SOX - 塞班斯法案,HIPAA - 健康保险流通与责任法案,GLBA - 格莱姆-布里勒法案,还有各地区的个人资产保护法,如日本出台了个人信息保护法案、欧盟出台了《隐私和电子通信指令》、香港特区也出台了政府安全规定、我国也从去年11月出台了《网络安全法》。在这些法规中都对数据的安全,从管理和技术上都进行了有效约束。 针对我国的金融业,也相继出台了《中国银行业“十二五”信息科技发展规则监管指导意见》和《银监会信息科技风险现场检查指南》加强数据、文档的安全管理,逐步建立信息资产分类分级保护机制。完善敏感信息存储和传输等高风险环节的控制措施,对数据、文档的访问应建立严格的审批机制。对用于测试的生产数据应对相应数据进行脱敏、变形处理,严格防止敏感数据泄露。 《国家安全法》 第四十二条 网络运营者应当采取技术措施和其他必要措施,确保其收集的个人信息安全,防止信息泄露、毁损、丢失 2013年1月31日证监会发布《证券期货业信息系统运维管理规范》, 5.4.6 在线数据和离线数据用于非生产环境时,应进行脱敏处理;用于模拟测试时如无法进行脱敏处理,测试环境应采取与生产环境相当的安全措施。 银监会《中国银行业“十二五”信息科技发展规则监管指导意见》 完善敏感信息存储和传输等高风险环节的控制措施,对数据、文档的访问应建立严格的审批机制。对用于测试的生产数据要进行脱敏处理,严格防止敏感数据泄露。 银监会信息科技风险现场检查指南 测试中如需使用生产数据,应对相应数据进行脱敏、变形处理,当使用生产数据测试时是否得到高级管理层的审批并采取相关限制及进行脱敏处理 银监办发[2014]317号《银行业应用安全可控信息技术推进指南》 总则…外包风险是指因信息科技外包而产生的…信息泄露等风险。… 2015年保监会发《保险机构信息化监管规定(征求意见稿)》 第二十二条[开发测试] 保险机构信息系统的开发测试应当与生产管理严格分离,不得使用未脱敏的生产数据用于开发、测试环境。严格限制开发人员访问源代码的权限,并保障核心系统开发实施安全。

3.数据脱敏

数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形,指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。很多单位和组织已经意识到了数据脱敏的重要性。著名咨询公司Gartner在《2014数据脱敏技术魔力象限》报告中就指出:“有越来越多的企业在通过战略方法进行数据脱敏。目前,全新的数据脱敏应用案例也在快速的涌现出来。

4.产品特点

“聚变2017”数据脱敏系统数据脱敏是指对用户敏感信息(如:客户账号、身份证号、电话、地址、银行卡等)通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试、分析和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。 和数据加密不同,数据脱敏是将数据通过一定的算法变成另一种样式,而这种样式是可读的,并且与原数据保持了同样的格式,能保存在原来的数据库表中。例如:对于某个时间串“19850110”,通过数据加密会得到“f%(KJt#v!=pEi%”,而通过数据脱敏,则可能会得到“19920703”。 所以,数据脱敏则具有良好地优势。其脱敏变换后的结果也是一个“真实的数据”,不仅仅数据长度、格式保持不变,而且还能满足原来的数据格式要求,比如身份证号仍然变换成身份证号、信用卡号仍然变换成信用卡号。这些优点是的数据脱密结果可以被已有的业务分析、数据挖掘、开发测试等系统使用。下图展示了一个数据脱敏的例子。 图 1 数据脱敏示例 “聚变2017”数据脱敏系统通过建立专业数据脱敏平台,对信息系统生产系统数据数据进行识别,自动发现找到敏感信息,实现目标数据库直接脱敏和数据文件采集脱敏,达到高质量脱敏数据交付目标。同时,通过任务监控管理,保证数据脱敏变换过程的自动化和高效执行,以保护隐私数据。 “聚变2017”数据脱敏系统支持Oracle、MySQL、SQL Server、Informix等主流数据库,支持Windows、Linux、AIX、Solaris等多个主流数据库应用平台,提供灵活的脱敏规则配置及脱敏规则扩展。可广泛适用于银行、证券、保险等金融机构,同时在电信、政府部门、军队单位、医院、学校以及企事业单位也有良好适用场景。产品在国家等级保护、分级保护等领域均具有很强的政策合规性。

5.设计原则

合规性原则 系统需符合我国国家法规、政策、标准,以及银行、医疗、电信、学校、政府等行业的相关技术规范和要求。

可靠性原则 系统可防止数据丢失或破坏,提供对数据丢失和出错实现恢复和容错的机制和数据丢失出错的解决方案。

可扩展性原则 系统可支持多种硬件平台,支持多种数据源,支持多种数据库平台,具备良好的可移植性。支持与其它系统的数据交换和共享。

易操作性 系统操作必须简单、便捷,因此,系统将力求直观、方便、可操作,便于用户使用和管理,以发挥系统的最大实际效益。

6.产品架构

“聚变2017”数据脱敏系统和企业内部管理流程结合,充分体现重要数据“使用申请、脱敏交付、用后销毁”等安全业务流程,并提供高性能的数据脱敏能力,其可以在管理员的简单操作下,管理从业务生产系统源数据库到测试数库的脱敏过程,将重要、敏感的生产数据抽取、脱敏并生成测试数据。系统总体架构如下图所示:

“聚变2017”数据脱敏系统支持业务系统的测试数据管理以及脱敏,将生产数据抽取、脱敏并生成测试数据,供目标应用使用。本方案支持通过数据库接口、文件接口以及定制接口对数据源和目标数据读取和保存。

7.系统指标

7.1.系统性能指标:

1.支持Oracle、SQL server、GBase、Mysql、MongoDB等多种数据库,支持TXT、CSV、DOC、DOCX等格式文档,支持源数据库和目标数据库异构;

2.自动发现和匹配。自动对数据源进行扫描,支持自动发现敏感数据,支持自动匹配最佳规则;

3.权限控制功能。对脱敏系统本身进行配置、管理、审计权限分离;

4.日志和报表功能。有相应的日志、审计、报表功能。日志要求记录已脱敏的数据库、表的数量;成功和异常脱敏的数据条目数;记录未成功脱敏的条目信息;报表能将日志记录信息按照图、表等形式展现;

5.任务管理功能。支持多任务管理,允许同时运行多个脱敏任务。

7.2.脱敏规则:

1.需要具备屏蔽、变形、替换、随机等算法。例如:将地址信息变换为随机地址、将信用卡号变换为符合规则的行用卡号、将出生日期变换为恰当的出生日期、将手机号码部分隐藏,用*号代替、将车牌号替换为随机数字和字母等;

2. 具备根据不同的字段组合和算法定义成一套脱敏策略,支持多套策略的制定,根据不同的应用场景和数据库,选择使用已定义策略进行相应数据的脱敏。例如支持对保留身份证号中的年代信息、对其他信息进行变换,以便于按照年代对数据进行统计;

3. 每一种隐私信息至少有10种以上变换规则,允许管理员指定,支持可逆和不可逆变换规则。

7.3.脱敏场景:

1. 持源数据库直接到目标数据库的脱敏;

2. 支持在数据从生产库迁移到测试库的过程中脱敏;

3. 支持脱敏后生成csv、dmp、TXT等文件;

4. 支持保留数据关联。不破坏原始数据的逻辑关系,特别是在大数据量的情况下,脱敏后的数据关联规律要保留,便于数据挖掘分析使用;

5. 支持对数据库索引的脱敏,且保留索引关系;

6. 支持保留数据唯一性。原来相同的字段值脱敏后也相同,原不同的字段值脱敏后也不同。例如客户的身份证号码仍保持唯一性。

7.4.权限管理:

1. 具备完善、统一的权限管理体系,可以针对不同用户设置不同角色,不同角色设置不同权限,不同业务对象授权给不同用户等全方位的权限保护措施,实现数据行级的权限控制;

2. 支持增加操作员,支持为操作员分配和赋予相应的角色权限;

3. 支持“三员安全管理”,默认包括“系统管理员”、“安全管理员”以及“安全审计员”3种用户角色,分别负责系统运维管理、用户权限管理以及系统审计等职责。三个角色分工不同,相互监督,确保系统安全运行;

4. 管理员及操作员访问地址限制,支持设定允许访问的管理端IP地址,不在此地址范围的管理端不能登录系统。

7.5.性能指标:

1. 脱敏数据大于5000万条/小时。

2.系统界面响应时间小于2秒。

3. 敏感数据快速智能发现。

4. 数据保留格式脱敏,脱敏过程数据不落地。

5. 可固定脱敏因子,实现同数据在不同任务中脱敏后完全一样。

6. 每次脱敏完成后生成任务报告,详细记录脱敏过程。

7.采用向导六步操作创建脱敏任务并指定任务运行方式(自动、 手动、定时、定期) 实现任务一次创建多次使用,易用高效。

8.系统部署

8.1.系统部署

1.部署方式 数聚世界数据脱敏平台将源系统数据库中敏感信息数据进行抽取、脱敏、装载等一系列操作,实现目标(非生产)环境数据库智能搭建、敏感信息脱敏等功能,达到客户敏感数据屏蔽/脱敏需求。一般情况下,网络部署方式如下图所示。

2.登录方式 界面采用B/S登录方式,在浏览器打开中平台地址https://IP:8904,出现系统的登录窗口,输入用户及其密码即可登录系统。

8.2.系统软硬件要求: