[发明专利]一种应用于电子邮箱地址的字符编码方法及系统在审
申请号: | 201910091848.2 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109660262A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 谢文辉;王敏;刘江桥;张浩;汪翔;杨柳;周期律;常学亮;张轶;孙光辉;罗春江;刘引;汪哲逸 | 申请(专利权)人: | 重庆农村商业银行股份有限公司 |
主分类号: | H03M7/40 | 分类号: | H03M7/40 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 李英 |
地址: | 400000 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子邮箱地址 字符编码 二进制 霍夫曼编码 自定义 应用 实际生产数据 服务器定义 编码过程 编码效率 电子邮箱 原始空间 移位 脱敏 | ||
本发明公开了一种应用于电子邮箱地址的字符编码方法及系统,进行以下步骤:将电子邮箱地址按照字符拆分为用户自定义部分和服务器定义部分;将电子邮箱地址的用户自定义部分通过霍夫曼编码方法进行编码。本发明解决了现有技术存在的对电子邮箱的脱敏方法在字符编码过程中效率不高、耗费空间的问题,提供一种应用于电子邮箱地址的字符编码方法,其应用时编码过程,都是可以通过移位,与,或等二进制操作来完成,目前CPU中,执行二进制操作是非常高效的,提升编码效率,由于霍夫曼编码表是根据实际生产数据而得出的编码,因此使用该编码对整个库的邮箱编码后得到的二进制大小比原始空间可以节省大量空间。
技术领域
本发明涉及字符编码领域,具体涉及一种应用于电子邮箱地址的字符编码方法及系统。
背景技术
由于银行的数据库系统中,存有大量的个人的隐私敏感信息。而在银行的日常工作中,又时刻需要各种数据来开展工作,数据泄露的风险很大,所以需要对敏感信息进行加工处理,隐藏隐私敏感数据。
电子邮箱地址对于个人来是一个比较重要的隐私信息,不仅通过该邮箱可以联系到所有者,而且很多网站,手机端的app应用都是可以通过邮箱绑定,甚至一些重要的账号找回功能也可以通过邮箱来重置。目前电子邮箱地址由于不太重视,脱敏方法较为简单主要分为下面几类:
1、符号替换法,直接以特殊符号(如*)把所有(或部分)字母替换。
2、编码移位法,将各个字母的编码移动固定位数,如a移位变成b,b移位变成c。
上面几种方法存在一些缺点,第一种可以有效隐藏敏感信息,但是由于其替换后多个邮箱地址对应同一个编码后的地址,打破数据的关联关系,如两张数据表有相同地址的邮箱,实施该方法脱敏后,分析人员无法知道两条数据对应的是同一个地址。第二种保持了一对一的关联关系,但是容易从已知的脱敏结果中推算出偏移的参数,从而得到原数据。
发明内容
本发明解决了现有技术存在的对电子邮箱的脱敏方法在字符编码过程中效率不高、耗费空间的问题,提供一种应用于电子邮箱地址的字符编码方法及系统,其应用时编码过程,都是可以通过移位,与,或等二进制操作来完成,目前CPU中,执行二进制操作是非常高效的,提升编码效率,由于霍夫曼编码表是根据实际生产数据而得出的编码,因此使用该编码对整个库的邮箱编码后得到的二进制大小比原始空间可以节省大量空间。
本发明通过下述技术方案实现:
一种应用于电子邮箱地址的字符编码方法,进行以下步骤:
A、将电子邮箱地址按照字符拆分为用户自定义部分和服务器定义部分;
B、将电子邮箱地址的用户自定义部分通过霍夫曼编码方法进行编码。
本发明提供的电子邮箱地址脱敏方法的编码步骤如下:
拆分--编码--压缩
首先根据邮箱地址的@符号,将邮箱的用户名与域名拆开。根据业务场可以按需用户名和域名分别进行脱敏或仅对用户名进行脱敏。本发明中,按仅对用户名进行脱敏来阐述原理。
编码、压缩
电子邮箱地址字符允许的字符为字母、数字、句点、连字符或下划线五类共出39个字符(英文字母不区分大小写)。其频率特征较为明显,经申请人统计,排名前6位的字母出现频率加起来超过了50%,因此本发明利用在压缩领域广泛应用的霍夫曼编码算法可以有效地对邮箱地址进行压缩存储。
霍夫曼编码原理:霍夫曼编码是一种异字头的变字长编码,基本原理用最短的编码表示频率最高的字符,频率最低的字符用最长的编码表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆农村商业银行股份有限公司,未经重庆农村商业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910091848.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据压缩
- 下一篇:一种适用于MLC NAND闪存的LDPC码译码方法