[发明专利]随机分组方法、装置、计算机设备及存储介质在审
申请号: | 202110903958.1 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113782120A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 文天才;刘保延;何丽云;吕晓颖 | 申请(专利权)人: | 中国中医科学院中医药信息研究所 |
主分类号: | G16H10/20 | 分类号: | G16H10/20;G06F17/18 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 项凯 |
地址: | 100700 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机 分组 方法 装置 计算机 设备 存储 介质 | ||
本发明涉及数据统计领域,具体涉及一种随机分组方法、装置、计算机设备及存储介质,包括如下步骤:获取待分组样本,待分组样本为临床试验测量的指标数值;根据处理组的数量、每个处理组中的数据、待分组样本对应的类别的权重及类别的数量,依次计算将待分组样本加入每个处理组得到的综合评价指标值;根据综合评价指标值,确定综合评价指标值最小时待分组样本所加入的目标处理组,并将待分组样本划分至目标处理组。直接利用待分组样本所包含的数值变量进行计算,从而不会损失数值变量中所包含的信息,使得分类结果更加均衡、组间分布差异最小。
技术领域
本发明涉及数据统计领域,具体涉及一种随机分组方法、装置、计算机设备及存储介质。
背景技术
临床试验是指通过让某个特定人群参与某项临床研究,以评价某种医学治疗对健康的影响和作用。为了使临床试验获得真实、客观的结论,临床试验十分强调随机原则。
随机的作用是使各种控制因素在处理组之间均衡分布,从而消除其对研究结果的影响。通过随机化分组技术,使进入各处理组的数据可以在基线特征上尽可能保持一致,即达到统计学上的组间可比性,从而避免控制因素影响到对干预措施的效果评价。
在临床试验的动态随机化算法中,主要采用传统的最小化法。但是传统的最小化法只能直接处理分类变量而无法直接处理数值变量。当分层因素涉及数值变量时,则需要将数值变量转化为分类变量,但这将会损失原有数值变量本身的信息,且如果存在多个分层因素,就会使数值变量本身损失更多的信息,最终影响到实验结果的准确性。
发明内容
因此,本发明要解决传统的最小化法不能直接计算数值变量,在将数值变量转变为分类变量时,会损失数值变量本身的信息,最终影响到实验结果的准确性的技术问题,从而提供一种随机分组方法,用于将待分组样本划分至对应的处理组中,包括如下步骤:
获取待分组样本,所述待分组样本为临床试验测量的指标数值;
根据处理组的数量、每个处理组中的数据、待分组样本对应的类别的权重及类别的数量,依次计算将所述待分组样本加入每个处理组得到的综合评价指标值;
根据所述综合评价指标值,确定综合评价指标值最小时待分组样本所加入的目标处理组,并将所述待分组样本划分至所述目标处理组。
优选地,所述根据处理组的数量、每个处理组中的数据、待分组样本对应的类别的权重及类别的数量,依次计算将所述待分组样本加入每个处理组得到的综合评价指标值,包括:
采用第一数学模型,或第二数学模型,根据处理组的数量、每个处理组中的数据、待分组样本对应的类别的权重及类别的数量,依次计算将所述待分组样本加入每个处理组得到的综合评价指标值。
优选地,所述第一数学模型为:
其中,G表示处理组的个数,g表示第g个处理组;M表示分层因素的个数,m表示第m个分层因素,wm表示第m个分层因素的权重;和分别表示从所有处理组中取出任意两处理组在待分组样本上的均值,和分别表示从所有处理组中取出任意两处理组在待分组样本上的方差,n1和n2分别表示从所有处理组中取出任意两处理组的样本量。
优选地,所述方法还包括:将处理组进行两两排列组合形成对照组;
所述第二数学模型为:
其中,M表示分层因素的个数,m表示第m个分层因素,wm表示第m个分层因素的权重;和分别表示所述对照组中两处理组在待分组样本上的均值,和分别表示所述对照组中两处理组在待分组样本上的方差,n1和n2分别表示所述对照组中两处理组在待分组样本上的样本量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国中医科学院中医药信息研究所,未经中国中医科学院中医药信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110903958.1/2.html,转载请声明来源钻瓜专利网。