[发明专利]用于为临床试验提供记录选择的基于地理聚类数据的数据库缩减在审
申请号: | 202080028134.8 | 申请日: | 2020-04-07 |
公开(公告)号: | CN113711196A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | S·M·琼斯;M·L·琼斯;M·B·加西亚;E·M·玛莎尔丝;R·黑格 | 申请(专利权)人: | 美国控股实验室公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/28;G06Q10/06 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 鲍进 |
地址: | 美国北*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 临床试验 提供 记录 选择 基于 地理 数据 数据库 缩减 | ||
1.一种系统,包括:
数据存储库;
非暂态计算机可读介质,包括用于数据库记录选择的计算机程序代码;以及
处理设备,可通信地耦合到所述数据存储库和所述非暂态计算机可读介质,其中所述处理设备被配置用于执行所述计算机程序代码以执行包括以下的操作:
识别地理聚类数据的数据源,所述地理聚类数据包含要写入到所述数据存储库的数据库记录的对应描述符;
格式化所述对应描述符以产生标准化的对应描述符;
匹配所述标准化的对应描述符中每个标准化的对应描述符以产生每个标准化的对应描述符的记录分数;
组合所述标准化的对应描述符的记录分数以产生数据库记录中的每条数据库记录的总分数;以及
基于所述总分数选择性地将每条数据库记录写入到所述数据存储库以编译数据库。
2.如权利要求1所述的系统,其中所述记录分数通过包括以下的操作产生:
从所述匹配产生Damerau-Levenshtein分数以产生修改后的Damerau-Levenshtein分数;以及
使用修改后的Damerau-Levenshtein分数产生二进制分数。
3.如权利要求2所述的系统,其中使用机器学习模型产生所述总分数,所述机器学习模型是使用已知匹配和误配训练的。
4.如权利要求1所述的系统,其中每条数据库记录对应于临床试验研究者或与所述临床试验研究者对应的临床试验站点中的至少一个。
5.如权利要求4所述的系统,其中所述操作还包括使用空间聚类分析来产生所述地理聚类数据以从多个预期临床试验研究者中确定在所述临床试验研究者的指定距离内的多个预期临床试验受试者。
6.如权利要求5所述的系统,其中所述操作还包括:
确定所述临床试验研究者的适应性可行性;以及
至少部分地基于所述适应性可行性产生所述多个预期临床试验研究者的测试站点分布。
7.如权利要求6所述的系统,其中所述操作还包括基于临床试验信息更新所述数据存储库。
8.一种方法,包括:
由处理设备识别地理聚类数据的数据源,所述地理聚类数据包含要写入到所述数据存储库的数据库记录的对应描述符;
由所述处理设备格式化所述对应描述符以产生标准化的对应描述符;
由所述处理设备匹配所述标准化的对应描述符中每个标准化的对应描述符以产生每个标准化的对应描述符的记录分数;
由所述处理设备组合所述标准化的对应描述符的记录分数以产生数据库记录中的每条数据库记录的总分数;以及
由所述处理设备基于所述总分数选择性地将每条数据库记录写入到所述数据存储库以编译数据库。
9.如权利要求8所述的方法,其中每个标准化的对应描述符的匹配还包括:
从所述匹配产生Damerau-Levenshtein分数以产生修改后的Damerau-Levenshtein分数;以及
使用修改后的Damerau-Levenshtein分数产生二进制分数。
10.如权利要求9所述的方法,其中使用机器学习模型产生所述总分数,所述机器学习模型是使用已知匹配和误配训练的。
11.如权利要求8所述的方法,其中每条数据库记录对应于临床试验研究者或与所述临床试验研究者对应的临床试验站点中的至少一个。
12.如权利要求11所述的方法,还包括使用空间聚类分析来产生所述地理聚类数据以从多个预期临床试验研究者中确定在所述临床试验研究者的指定距离内的多个预期临床试验受试者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国控股实验室公司,未经美国控股实验室公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080028134.8/1.html,转载请声明来源钻瓜专利网。