[发明专利]卡方检验方法、装置、服务器以及存储介质在审
| 申请号: | 202111664856.5 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114357513A | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 邱炜伟;汪小益;刘毅恒;李伟;张帅 | 申请(专利权)人: | 杭州趣链科技有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/2458 |
| 代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 汪阮磊 |
| 地址: | 310051 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 检验 方法 装置 服务器 以及 存储 介质 | ||
1.一种卡方检验方法,其特征在于,应用于与发起节点对应的服务器,所述方法包括:
获取本地样本数据在不同第一分类变量下各个第二分类变量对应的样本观测频数,并对所述样本观测频数进行卡方检验分片处理,获取所述第一分类变量以及所述第二分类变量间的第一卡方值分片数据;
接收参与节点发送的第二卡方值分片数据;
根据所述第一卡方值分片数据以及所述第二卡方值分片数据,获取卡方检验结果,所述卡方检验结果用于标识不同分类变量间的相关性。
2.根据权利要求1所述的方法,其特征在于,所述对所述样本观测频数进行卡方检验分片处理,获取所述第一分类变量以及所述第二分类变量间的第一卡方值分片数据,包括:
获取所述本地样本数据中在各个所述第一分类变量下的第一本地样本统计频数和在各个所述第二分类变量下的第二本地样本统计频数;
接收所述参与节点发送的在各个所述第一分类变量下的第一远程样本统计频数和在各个所述第二分类变量下的第二远程样本统计频数;
根据所述第一本地样本统计频数、第二本地样本统计频数、第一远程样本统计频数以及第二远程样本统计频数,获取在不同第一分类变量下各个第二分类变量下的样本期望频数;
基于在不同第一分类变量下各个第二分类变量对应的样本期望频数以及所述样本观测频数,获取所述第一卡方值分片数据。
3.根据权利要求2所述的方法,其特征在于,所述基于在不同第一分类变量下各个第二分类变量对应的样本期望频数以及所述样本观测频数,获取第一卡方值分片数据,包括:
分别将不同第一分类变量下不同第二分类变量对应的类别确定为目标样本类别,基于所述目标样本类别的样本观测频数以及所述目标样本类别的样本期望频数,获取所述目标样本类别的偏离度分片数据;
将各所述目标样本类别的偏离度分片数据的和值,确定为所述第一卡方值分片数据。
4.根据权利要求1所述的方法,其特征在于,所述对所述样本观测频数进行卡方检验分片处理,获取所述第一分类变量以及所述第二分类变量间的第一卡方值分片数据,包括:
对所述样本观测频数进行分片操作,得到第一本地分片数据以及第一远程分片数据,并将所述第一远程分片数据分发至所述参与节点中;
获取所述参与节点分发的第二远程分片数据,基于所述第二远程分片数据以及所述第一本地分片数据,获取第一偏离度分片项;
将所述第一偏离度分片项发送至聚合方服务器,所述第一偏离度分片项用于指示所述聚合方服务器基于所述第一偏离度分片项获取并返回第二偏离度分片项;
根据所述样本观测频数以及所述第二偏离度分片项,获取所述第一分类变量以及所述第二分类变量间的第一卡方值分片数据。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述根据所述第一卡方值分片数据以及所述第二卡方值分片数据,获取卡方检验结果,包括:
获取所述第一卡方值分片数据与所述第二卡方值分片数据的和值,得到卡方值;
根据所述卡方值以及预设自由度,获取所述卡方检验结果。
6.一种卡方检验方法,其特征在于,应用于与参与节点对应的服务器,所述方法包括:
获取本地样本数据在不同第一分类变量下各个第二分类变量对应的样本观测频数,并对所述样本观测频数进行卡方检验分片处理,获取所述第一分类变量以及所述第二分类变量间的第二卡方值分片数据;
将所述第二卡方值分片数据发送至发起节点,所述第二卡方值分片数据用于指示发起节点根据所述第二卡方值分片数据,获取卡方检验结果,所述卡方检验结果用于标识不同分类变量间的相关性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州趣链科技有限公司,未经杭州趣链科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111664856.5/1.html,转载请声明来源钻瓜专利网。





