当前位置:首页 » 数据仓库 » 数据库脱敏处理
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

数据库脱敏处理

发布时间: 2022-11-18 16:20:20

‘壹’ 什么是静态数据脱敏

一. 数据脱敏是什么?
数据脱敏顾名思义就是对敏感数据进行变形处理,其目的是保护隐私数据等信息的安全,例如机构和企业收集的个人身份信息、手机号码、银行卡信息等敏感数据。数据脱敏从技术上可以分为静态数据脱敏和动态数据脱敏两种。静态数据脱敏一般应用于数据外发场景,例如需要将生产数据导出发送给开发人员、测试人员、分析人员等;动态脱敏一般应用于直接连接生产数据的场景,例如运维人员在运维的工作中直接连接生产数据库进行运维,客服人员通过应用直接调取生产中的个人信息等。

二. 数据脱敏的实现方式有哪些?
1、 使用脚本进行脱敏
事实上,很多用户在信息化发展的早期,就已经意识到了数据外发带来的敏感数据泄露的风险,那时候用户往往通过手动方式直接写一些代码或者脚本来实现数据的脱敏变形,比如:简单的将敏感人的姓名、身份证号等信息替换为另一个人的,或者将一段地址随机变为另一个地址。
2、使用专业的数据脱敏产品进行脱敏
近年来,随着各行业信息化管理制度的逐步完善、数据使用场景愈加复杂、脱敏后数据仿真度要求逐渐提升,为保证脱敏果准确而高效,专业化的数据脱敏产品逐渐成为了用户的普遍选择。相比传统的手工脱敏方法,专业的脱敏产品除了保证脱敏效果可达,更重要的价值点在于提高脱敏效率,在不给用户带来过多额外工作量的同时,最大程度节省用户操作时间。
三. 数据脱敏技术
数据脱敏的基本原理是通过脱敏算法将敏感数据进行遮蔽、变形,将敏感级别降低后对外发放,或供访问使用。根据不同的使用场景可以分为“静态脱敏”和“动态脱敏”两类技术,这两类脱敏技术从适用场景、技术手段、部署方式三个方面有所不同。
1、静态脱敏与动态脱敏使用场景和用途的区别
静态脱敏适用于将数据抽取出生产环境脱敏后分发至测试、开发、培训、数据分析等场景。
原理是将数据抽取进行脱敏处理后,下发至脱敏库。开发、测试、培训、分析人员可以随意取用脱敏数据,并进行读写操作,脱敏后的数据与生产环境隔离,满足业务需要的同时保障生产数据的安全,静态脱敏可以概括为数据的“搬移并仿真替换”。
动态脱敏适用于不脱离生产环境,对敏感数据的查询和调用结果进行实时脱敏。
原理是将生产库返回的数据进行实时脱敏处理,例如应用需要呈现部分数据,但是又不希望应用账号可以看到全部数据;运维人员需要维护数据,但又不希望运维人员可以检索或导出真实数据,动态脱敏可以概括为“边脱敏,边使用”。
2、静态脱敏与动态脱敏的技术路线的区别
静态脱敏直接通过屏蔽、变形、替换、随机、格式保留加密(FPE)和强加密算法(如AES)等多种脱敏算法,针对不同数据类型进行数据掩码扰乱,并可将脱敏后的数据按用户需求,装载至不同环境中。静态脱敏可提供文件至文件,文件至数据库,数据库至数据库,数据库至文件等不同装载方式。导出的数据是以脱敏后的形式存储于外部存贮介质中,实际上已经改变了存储的数据内容。
动态脱敏通过准确的解析SQL语句匹配脱敏条件,例如:访问IP、MAC、数据库用户、客户端工具、操作系统用户、主机名、时间、影响行数等,在匹配成功后改写查询SQL或者拦截防护返回脱敏后的数据到应用端,从而实现敏感数据的脱敏。实际上存储于生产库的数据未发生任何变化。
3、静态脱敏与动态脱敏的部署方式的区别
静态脱敏可将脱敏设备部署于生产环境与测试、开发、共享环境之间,通过脱敏服务器实现静态数据抽取、脱敏、装载。
动态脱敏采用代理部署方式:物理旁路,逻辑串联。应用或者运维人员对数据库的访问必须都经过动态脱敏设备才能根据系统的规则对数据访问结果进行脱敏。
四. 数据脱敏的价值?
无论是静态脱敏还是动态脱敏其最终都是为了防止组织内部对隐私数据的滥用,防止隐私数据在未经脱敏的情况下从组织流出。满足组织既要保护隐私数据,同时又保持监管合规,满足合规性。

‘贰’ 数据脱敏简单来说是什么意思

就是把一些敏感的信息去掉。

譬如一个信息里面含有一些身份证件之类的信息,还有类似姓名、性别等其他敏感数据。

可以通过一定的程序语句,在调阅的时候,把敏感信息去掉。

这个就叫数据的脱敏。

‘叁’ 静态数据脱敏系统处理方法有哪些

1、利用单台服务器部署方式将连接业务部门的生产数据库,对生产数据进行抽取和数据脱敏,脱敏后的数据输出到测试部门的测试数据库中,供测试部门使用数据。单服务器部署模式用于客户生产环境网络和测试环境网络允许通过设备进行连接的使用场景。2、成对服务器部署方式在业务部门数据出口及测试部门数据入口分别部署脱敏服务器,可将业务部门的数据进行有效隔离,通过offline的方式,满足测试部门使用业务部门脱敏后数据的需求。多服务器模式用于客户生产环境网络和测试环境网络需要隔离的使用场景。使用该方法可实现保护隐私数据合规、保证业务可靠运行、敏感数据统一管理。

‘肆’ 什么是数据库脱敏技术

安华金和数据库脱敏技术目前已经很成熟,具体是指敏感数据发现、数据抽取、数据脱敏、数据输出的主流程技术功能,同时包括数据源管理、脱敏任务管理、算法配置关联、用户权限管理等,采用专门的脱敏算法对敏感数据进行屏蔽、随机替换、乱序处理和加密,将敏感数据转化为虚构数据,将个人信息匿名化。同时,在不改变业务系统逻辑的前提下,保证脱敏后的数据保留原数据的特征和分布。

‘伍’ 哪位大神知道大数据脱敏系统具备哪些功能啊

我觉得大数据脱敏系统首先至少支持hive等大数据组件等,具体功能也应该包括1、敏感数据发现:能够按照用户指定的系统内置敏感数据特征或预定义的敏感数据特征,在执行任务过程中对抽取的数据进行自动识别和敏感数据发现;2、敏感数据梳理:具备敏感数据梳理能力,包含数据库敏感字段和文件敏感列的梳理和核实;3、数据子集管理:在许多场景下,并不需要将生产环境中的全部数据脱敏至目标环境使用,如统计分析场景则需要对全部数据进行合理采样,开发环境可能仅需要生产环境中1%的数据;4、脱敏方案管理:可以根据各类数据应用场景如系统开发、功能测试、性能测试、数据分析等,制定不同的脱敏方案;5、脱敏任务管理:脱敏任务可针对目标数据库系统或结构化文件进行;安华金和大数据脱敏系统推荐你了解下。

‘陆’ 数据脱敏是什么

数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。数据安全技术之一,数据库安全技术主要包括:数据库漏扫、数据库加密、数据库防火墙、数据脱敏、数据库安全审计系统。数据库安全风险包括:拖库、刷库、撞库。
1、静态脱敏与动态脱敏使用场景和用途的区别
静态脱敏适用于将数据抽取出生产环境脱敏后分发至测试、开发、培训、数据分析等场景。
原理是将数据抽取进行脱敏处理后,下发至脱敏库。开发、测试、培训、分析人员可以随意取用脱敏数据,并进行读写操作,脱敏后的数据与生产环境隔离,满足业务需要的同时保障生产数据的安全,静态脱敏可以概括为数据的“搬移并仿真替换”。
动态脱敏适用于不脱离生产环境,对敏感数据的查询和调用结果进行实时脱敏。
原理是将生产库返回的数据进行实时脱敏处理,例如应用需要呈现部分数据,但是又不希望应用账号可以看到全部数据;运维人员需要维护数据,但又不希望运维人员可以检索或导出真实数据,动态脱敏可以概括为“边脱敏,边使用”。
2、静态脱敏与动态脱敏的技术路线的区别
静态脱敏直接通过屏蔽、变形、替换、随机、格式保留加密(FPE)和强加密算法(如AES)等多种脱敏算法,针对不同数据类型进行数据掩码扰乱,并可将脱敏后的数据按用户需求,装载至不同环境中。静态脱敏可提供文件至文件,文件至数据库,数据库至数据库,数据库至文件等不同装载方式。导出的数据是以脱敏后的形式存储于外部存贮介质中,实际上已经改变了存储的数据内容。
动态脱敏通过准确的解析SQL语句匹配脱敏条件,例如:访问IP、MAC、数据库用户、客户端工具、操作系统用户、主机名、时间、影响行数等,在匹配成功后改写查询SQL或者拦截防护返回脱敏后的数据到应用端,从而实现敏感数据的脱敏。实际上存储于生产库的数据未发生任何变化。
3、静态脱敏与动态脱敏的部署方式的区别
静态脱敏可将脱敏设备部署于生产环境与测试、开发、共享环境之间,通过脱敏服务器实现静态数据抽取、脱敏、装载。
动态脱敏采用代理部署方式:物理旁路,逻辑串联。应用或者运维人员对数据库的访问必须都经过动态脱敏设备才能根据系统的规则对数据访问结果进行脱敏。

‘柒’ 动态数据脱敏和静态数据脱敏有什么区别如何选择

数据脱敏

数据脱敏的主要作用是对敏感数据按需进行漂白、变形、遮盖等处理,避免敏感信息泄露。可实现自动化发现源数据中的敏感数据,同时又能保证脱敏后的输出数据能够保持数据的一致性和业务的关联性。数据脱敏一般分为动态数据脱敏和静态数据脱敏。那么,两者之间有什么区别?分别在什么情况下使用呢?

数据脱敏

动态数据脱敏常用在访问敏感数据即时进行脱敏,一般用来解决在生产环境需要根据不同情况对同一敏感数据读取时进行不同级别脱敏的场景,如业务脱敏、运维脱敏、数据交换脱敏等场景。首先,业务脱敏主要针对不同权限业务用户访问敏感数据时,采取不同级别的脱敏规则。其次,在运维脱敏场景中,许多企业的数据库在运行中都面临以下几个问题:1. 共享、临时账号滥用现象,导致运维身份不清。2. 特权用户访问敏感数据,行为不受控。3. 当运维人员误操作,关键数据丢失,数据难以恢复。4. 无法监控数据库内部操作,无法进行追责溯源。面对上述问题,动态脱敏可以实现授权账号进行访问控制,对未授权的运维身份访问敏感数据实现动态脱敏功能。同时,保证数据库被误操作后快速回复,并实时监控数据库内部操作。最后,数据交换场景,是指通过API接口进行数据交换是非常常见的场景,通过API接口向特定平台提供数据时,需要对不同的用户信息提供不同的脱敏策略。

静态数据脱敏则一般应用在非生产环境或脱离原生业务系统使用。开发测试、数据共享、科学研究时静态数据脱敏的三个典型应用场景。首先,在开发测试场景中,比如银行证券等敏感信息系统中包含有姓名、身份、账号等敏感信息,但开发测试需要使用这些真实的数据,因此需要通过脱敏手段保证敏感数据不被泄露。其次,数据共享场景通常是在一些特定的需求下,将数据与其他部门或者外部企业共享。此时需要保留部分敏感数据,对特定的敏感数据进行处理。最后科学研究场景通常核心是将对数据进行统计分析,并将结果用于科学研究。那么就需要保证,对数据进行脱敏之后仍数据仍保留原本的特征和科学研究所所必须的内容。

不论是静态数据脱敏还是动态数据脱敏,都不会对敏感数据(核心数据)造成破坏,并且保持数据原有的可用性。换言之,即使数据进行了脱敏操作(去掉了敏感信息),数据共享方仍然可以使用、可以处理、可以提取相应的特征价值。

‘捌’ 数据库脱敏有用吗会不会损坏重要数据

数据库脱敏当然重要了,在企业和金融机构的后台数据库中,储存着大量的敏感信息。从商业惯例和数据安全角度,这些敏感信息都应该得到有效地保护,因为一旦发生信息泄密行为,不仅会造成重大的财产损失。
我了解到安华金和数据脱敏采用的脱敏算法对敏感数据进行屏蔽、随机替换、乱序处理和加密,将敏感数据转化为虚构数据,将个人信息匿名化,为数据的安全使用提供基础保障。同时,在不改变业务系统逻辑的前提下,保证脱敏后的数据保留原数据的特征和分布,使企业低成本、高效率、安全地使用生产环境的隐私数据,不会损毁重要数据。

‘玖’ 什么是数据脱敏处理

数据脱敏处理是指敏感数据发现:按照用户指定或预定义的敏感数据特征,对数据库进行识别,自动发现敏感数据。
数据抽取:建立数据子集,并根据数据子集的范围抽取数据。抽取的数据中可进行关联数据的自动识别和数据抽取。
数据脱敏:对抽取的数据按照用户指定或预定义的脱敏算法策略,对数据进行屏蔽、变形、替换、随机等数据脱敏处理。
数据加载:将脱敏完成后的数据根据用户指定的目标数据库或目标文件进行数据加载。安华金和数据脱敏产品入选到国有大型银行的供应商,国内应该最多2家入围了。