[发明专利]一种基于混淆主键的特征数据交换方法和系统在审
申请号: | 202111568363.1 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114328514A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 李剑峰 | 申请(专利权)人: | 重庆数聚魔方科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06F16/27;G06N20/00 |
代理公司: | 重庆天成卓越专利代理事务所(普通合伙) 50240 | 代理人: | 路宁 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混淆 主键 特征 数据 交换 方法 系统 | ||
1.一种基于混淆主键的特征数据交换方法,其特征在于,包括如下步骤:
S1,获取第一数据库A中实体对象特征数据,以及第二数据库B的实体对象特征数据,其中数据库B中的特征数据是机器学习算法需要进行预测的目标特征;
S2,通过使用特征数据交换和机器学习,将第二数据库B中目标特征数据在第一数据库A的特征数据中进行训练,从而产生机器学习模型在第一数据库A中对其他实体对象的目标特征进行预测,并且在此过程中双方不需要交换实体对象的具体特征数据和唯一标识信息。
2.根据权利要求1所述的基于混淆主键的特征数据交换方法,其特征在于,所述S1包括:
S1-1,第一数据库A中实体对象数据为{ID,X1,X2,X3,...,Xn},其中ID是实体对象唯一标识,X为实体对象的特征;
S1-2,第二数据库B中实体对象数据{ID,Y},其中ID是实体对象唯一标识,Y为实体对象的特征,是机器学习模型需要进行预测的目标特征。
3.根据权利要求1所述的基于混淆主键的特征数据交换方法,其特征在于,所述S2包括:
S2-1,在第二数据库中获取实体对象数据形成对象唯一标识集合,在集合中设置自由度;
S2-2,根据选择的自由度,将唯一标识集合进行混淆替换处理,混淆替换完成后发送至第一数据库A;
S2-3,在第一数据库A中根据替换规则进行逆向处理,得到新的唯一标识集合d;
S2-4,通过新的唯一标识集合d在第一数据库A中的查询出对象特征数据,生成特征矩阵,对特征矩阵进行矢量化映射,生成混淆后的特征矩阵。
4.根据权利要求3所述的基于混淆主键的特征数据交换方法,其特征在于,所述S2-1包括:
对象标识ID是由i位字符组成的,用K1,K2,K3...Ki表示;Ki的取值范围是一个字符的集合,集合里面的元素的个数叫做Ki的自由度设为Ti。
5.根据权利要求3所述的基于混淆主键的特征数据交换方法,其特征在于,所述S2-2包括:
在第二数据库B中从K`1,K`2,K`3...K`i中选取若干位集合{K`z1,K`z2,...,K`zj},并且将这些位上的字符替换成预先协定好的占位符生成混淆后的ID字符串P(ID`),传送给第一数据库A。
6.根据权利要求3所述的基于混淆主键的特征数据交换方法,其特征在于,所述S2-3包括:
第一数据库A收到P(ID`),将z1,z2...zj位的占位符遍历式替换成对应位的字符集中的所有元素,得到一个ID的集合,d={ID1,ID2....IDs},其中s=Tzi*Tz2*...Tzj。
7.根据权利要求6所述的基于混淆主键的特征数据交换方法,其特征在于,所述S2-4包括:
S2-A,在第一数据库A中查询自己的实体对象特征数据,查找到新的集合d中所有的ID在己方的特征数据,生成第一特征矩阵;
S2-B,第一数据库A选择映射函数:map(X):xi-fi,其中f为标量数字,对第一特征矩阵中的特征数据X进行矢量化映射形成第二特征矩阵;
S2-C,对第二特征矩阵进行检查,除了ID以外,其他任何f或者f的组合都不能唯一对应一行数据,如果不能满足该条件执行条件指令;
S2-D,第一数据库A将第二特征矩阵传送给第二数据库B,map(X)保存在第一数据库;
S2-E,第二数据库B收到第二特征矩阵以后执行,如果发现除了ID以外有f或者f的组合能够唯一对应一行数据,删除该行数据;
S2-F,第二数据库B通过收到的第二特征矩阵中的ID查询本地数据,获取目标特征Y,选择map(Y):yi-hi,并且将目标特征hi按照对于的ID拼接到第二特征矩阵中,并且删除ID列,生成第三特征矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆数聚魔方科技有限公司,未经重庆数聚魔方科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111568363.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能除甲醛装置
- 下一篇:一种端口网络流量调度判定方法及系统