[发明专利]卡方检验方法、装置、服务器以及存储介质在审
| 申请号: | 202111664856.5 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114357513A | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 邱炜伟;汪小益;刘毅恒;李伟;张帅 | 申请(专利权)人: | 杭州趣链科技有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/2458 |
| 代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 汪阮磊 |
| 地址: | 310051 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 检验 方法 装置 服务器 以及 存储 介质 | ||
本申请提供一种卡方检验方法、装置、服务器以及存储介质,获取本地样本数据在不同第一分类变量下各个第二分类变量对应的样本观测频数,并对样本观测频数进行卡方检验分片处理,获取第一分类变量以及第二分类变量间的第一卡方值分片数据,在接收参与节点发送的第二卡方值分片数据后,根据第一卡方值分片数据以及第二卡方值分片数据,获取卡方检验结果。通过卡方检验的发起节点以及参与节点各自对服务器本地的本地样本数据进行卡方检验分片处理,以获取用于描述分类变量间相关性的卡方值分片数据,后续发起节点基于各个卡方值分片数据重构卡法校验结果,实现在不同节点的明文数据不出库的情况下获取卡方检验结果,且避免噪声的引入,提高精确度。
技术领域
本申请涉及隐私数据处理技术领域,具体涉及一种卡方检验方法、装置、计算机设备以及存储介质。
背景技术
卡方检验是常用的统计学算法之一,可以检验变量之间是否据有相关性,在工业,互联网,医疗,交通和金融等等方面都有巨大的应用,如,在医疗行业中,可通过卡方检验计算某种癌症患病率和性别是否有关。但在,卡方检验往往需要大量样本数据,而样本数据往往由不同的持有方持有,不同的样本数据出于隐私保护并不会直接分享本地存储的样本数据。
现有的针对隐私数据的卡方检验往往是基于差分隐私算法实现的,差分隐私算法是通过增加不改变原有数据分布的噪声来实现隐私保护,由于噪声的增加,导致基于差分隐私算法的卡方检验精确度低。
发明内容
基于此,有必要针对上述技术问题,提供一种卡方检验方法、装置、计算机设备以及存储介质,用以实现在不同节点的明文数据不出库的情况下获取卡方检验结果的同时,避免噪声的引入,提高卡方检验的精确度。
第一方面,本申请提供一种卡方检验方法,应用于与发起节点对应的服务器,包括:
获取本地样本数据在不同第一分类变量下各个第二分类变量对应的样本观测频数,并对样本观测频数进行卡方检验分片处理,获取第一分类变量以及第二分类变量间的第一卡方值分片数据;
接收参与节点发送的第二卡方值分片数据;
根据第一卡方值分片数据以及第二卡方值分片数据,获取卡方检验结果,卡方检验结果用于标识不同分类变量间的相关性。
在本申请一些实施例中,对样本观测频数进行卡方检验分片处理,获取第一分类变量以及第二分类变量间的第一卡方值分片数据,包括:
获取本地样本数据中在各个第一分类变量下的第一本地样本统计频数和在各个第二分类变量下的第二本地样本统计频数;
接收参与节点发送的在各个第一分类变量下的第一远程样本统计频数和在各个第二分类变量下的第二远程样本统计频数;
根据第一本地样本统计频数、第二本地样本统计频数、第一远程样本统计频数以及第二远程样本统计频数,获取在不同第一分类变量下各个第二分类变量下的样本期望频数;
基于在不同第一分类变量下各个第二分类变量对应的样本期望频数以及样本观测频数,获取第一卡方值分片数据。
在本申请一些实施例中,基于在不同第一分类变量下各个第二分类变量对应的样本期望频数以及样本观测频数,获取第一卡方值分片数据,包括:
分别将不同第一分类变量下不同第二分类变量对应的类别确定为目标样本类别,基于目标样本类别的样本观测频数以及目标样本类别的样本期望频数,获取目标样本类别的偏离度分片数据;
将各目标样本类别的偏离度分片数据的和值,确定为第一卡方值分片数据。
在本申请一些实施例中,对样本观测频数进行卡方检验分片处理,获取第一分类变量以及第二分类变量间的第一卡方值分片数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州趣链科技有限公司,未经杭州趣链科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111664856.5/2.html,转载请声明来源钻瓜专利网。





