基于数据模糊化处理的数据脱敏研究

基于数据模糊化处理的数据脱敏研究罗长银陈学斌摘要:随着大数据产业的飞速发展,数据泄露和信息泄露事件也越来越多,基于这种情况下,如何对数据有力的保护成为我们研究的重点内容,本文利用简单替换加密和维吉尼亚两种传统的算法对数据进行加密,利用模糊集里面的隶属函数的方法,对数据进行简单的模糊化处理,并且运用匹配度公式和模糊量词的方法,对数据信息进行进一步的泛化处理,对单数据源的信息的保护起到了预期的效果。关键词:数据泄露;简单替换算法;维吉尼亚算法;模糊量词:TP391:ADOI:10.3969/j.issn.1003-6970.2019.10.002本文著录格式:罗长银,陈学斌.基于数据模糊化处理的数据脱敏研究[J].软件,2019,40(10):0610ResearchonDataDesensitizationBasedonDataFuzzyProcessingLUOChang-yin,CHENXue-bin*(NorthChinaUniversityofScienceandTechnology,KeyLaboratoryofDataScienceandApplicationofHebeiProvinceTangshanDataScienceKeyLaboratory,HebeiTangshan06300china)【Abstract】:Withtherapiddevelopmentofthebigdataindustry,dataleakageandinformationleakagehavebecomeourfamiliarterms.Inthiscase,howtoeffectivelyprotectdatahasbecomethefocusofourresearch.Inthispaper,twotraditionalalgorithms,simplereplacementencryptionandVirginia,areusedtoencryptdata,andthemembershipfunctioninthefuzzysetisusedtoencryptdata.Simplefuzzificationprocessing,andtheuseofmatchingdegreeformulaandfuzzyquantifiermethod,furthergeneralizationofdatainformationprocessing,Theprotectionofsingledatasourceinformationhasachievedthedesiredresults.【Keywords】:Dataleakage;Simplereplacement;Virginia;Fuzzyquantifiers0引言随着大数据在快速发展,也给人们带来了许多方面的挑战,首当其冲的就是信息安全的问题。比如今年刚结束的两会,人大委员张业遂就说:通过立法加强个人信息保护成为必然要求[1];360集团董事长兼CEO就说:安全应该成为发展人工智能的基础和前提[2]。甚至李克强总理在中国大数据产业峰会上就明确指出信息网络和数据安全是全球性的挑战,中国也不例外。由此可见,数据保护已经成为我们全球范围性的急需要解决的事情之一。1预备的知识模糊量词[3]是一个跨学科的研究对象,涉及数学、逻辑学、语言学、计算机科学、智能科学等广泛领域。模糊量词(也被成为语言量词)是指大多数、少数、大约十个、不多几个等表示不确切数量的语言成分。模糊集[4]:设区域,U到闭区间[0,1]的任一映射为:(1)(2)确定了U的一个模糊子集,简称模糊集,记作A。称为模糊集A的隶属函数,的大小反映了x对模糊集合A的隶属程度,简称为隶属度。就是说,论域U={x}上的模糊集合是指x中具有某种性质的元素全体,这些元素具有某个不分明的界限。对于U中任一元素,都能根据这种性质,用一个[0,1]上的函数来表征该元素属于A的程度。论域元素总是分明的,只有x的模糊子集A,B等才是模糊的,所以模糊集通常是模糊子集。的值接近于1,表示x属于A的程度高;接近于0,表示x属于A的程度低。数据脱敏[5]是指对某些敏感信息通过脱敏规则来进行数据的变形,实现对敏感数据甚至于隐私数据进行保护。在不违反系统规则的前提下,以及客户允许的情况下对客户提供的真实的数据进行改造并且提供测试使用,比如身份證号码、出生日期、学生在校时所填的信息等等都需要我们进行脱敏。或许你在不经意间就有可能把你的隐私数据泄露出去,比如出生证明里面的东西可能成为你个人或者一个家庭的银行卡或者其他情况的密码。由此可见,个人的信息泄露已经成为信息社会日益凸显的问题。2敏感数据的分类[6]首先,我们应该对敏感数据的规则进行分类:分为可恢复与不可恢复两类。可恢复类指脱敏后的数据可以通过一定的方式,恢复成原来的敏感数据,此类脱敏规则主要指各类加解密算法规则。不可恢复类指脱敏后的数据被脱敏的部分使用任何方式都不能恢复,般可分为替换算法和生成算法两类。数据脱敏方案分为静态数据脱敏和动态数据脱敏。静态数据脱敏是对原始数据进行一次脱敏后...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?