[发明专利]用于为临床试验提供记录选择的基于地理聚类数据的数据库缩减在审
申请号: | 202080028134.8 | 申请日: | 2020-04-07 |
公开(公告)号: | CN113711196A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | S·M·琼斯;M·L·琼斯;M·B·加西亚;E·M·玛莎尔丝;R·黑格 | 申请(专利权)人: | 美国控股实验室公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/28;G06Q10/06 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 鲍进 |
地址: | 美国北*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 临床试验 提供 记录 选择 基于 地理 数据 数据库 缩减 | ||
各方面和特征涉及在计算上缩减数据库的尺寸或复杂性,以便提高计算系统处理这种数据库的速度和效率,以便识别临床试验的研究者。在一些方面,处理设备执行的操作包括识别地理聚类数据的数据源,该地理聚类数据包含数据库记录的对应描述符。操作还包括格式化对应描述符以产生标准化的对应描述符,以及匹配每个标准化的对应描述符以产生该描述符的记录分数。可以组合记录分数以产生每条数据库记录的总分数,并且可以基于总分数选择数据库记录并将其写入到数据存储库。
相关应用的交叉引用
本申请要求于2019年4月12日提交的美国临时申请No.62/833,328的优先权和申请权益,该申请通过引用整体并入本文。
技术领域
本公开一般而言涉及用于消除数据库中的重复、不一致或以其它方式误导的记录的数据处理技术。更具体而言,但不作为限制,本公开涉及使用此类技术减小数据库的尺寸或复杂性,以便提高计算系统处理此类数据库的速度和效率,以便基于地理和临床表现(clinical performance)考虑识别临床试验的研究者。
背景技术
临床试验是将新疗法引入到医疗保健系统中的过程的重要部分。此类新疗法可以包括新颖疫苗、组合物(例如,药物组合物)、膳食补充剂、医疗和/或膳食选择、和/或医疗设备。临床试验可以用于生成关于安全性、有效性、患者依从性、易用性和与治疗相关的其它话题的数据。临床试验的规模和成本可能变化,并且它们可能涉及一个国家或多个国家中的一个研究中心或多个研究中心。
随着时间的推移,实践医疗的医生选择接受训练,使得他们可以作为临床试验研究者参与试验。研究者可能改变工作地点、结婚等,从而导致临床研究者数据库中看似不同的研究者条目。随着研究者详细信息的增加,临床试验研究者数据库的尺寸和复杂性也增加。组合随着时间的推移通过合并和购置累积的来自几个源的信息使这种情况持久化,从而创建了包含同一个体随时间推移的多个实例的数据库。数据库查询可能会返回对先前使用的研究者数量的高估,并且特定研究者的经验深度可能会跨多个条目而被稀释。手动审查数据库条目既费时又容易出错,尤其是当跨不止一个个体划分任务时。
发明内容
在一个示例中,一种系统包括数据存储库、包括计算机程序代码的非暂态计算机可读介质以及处理设备,其可通信地耦合到所述数据存储库和所述非暂态计算机可读介质。所述处理设备被配置用于执行所述计算机程序代码以执行操作。所述操作包括识别地理聚类数据的数据源,所述地理聚类数据包含要写入到所述数据存储库的数据库记录的对应描述符。所述操作还包括格式化所述对应描述符以产生标准化的对应描述符,以及匹配每个标准化的对应描述符以产生该描述符的记录分数。所述操作还包括组合所述标准化的对应描述符的记录分数以产生每条数据库记录的总分数,以及基于所述总分数选择性地将每条数据库记录写入到所述数据存储库以编译数据库。
在另一个示例中,一种方法包括识别地理聚类数据的数据源,该地理聚类数据包含要写入到数据存储库的数据库记录的对应描述符。该方法还包括格式化对应的描述符以产生标准化的对应描述符,以及匹配每个标准化的对应描述符以产生该描述符的记录分数。该方法还包括组合标准化的对应描述符的记录分数以产生每条数据库记录的总分数,并基于总分数选择性地将每条数据库记录写入到数据存储库以编译数据库。
在另一个示例中,一种非暂态计算机可读介质包括可由处理器执行以使处理器执行操作的计算机程序代码。所述操作包括识别地理聚类数据的数据源,该地理聚类数据包含要写入到数据存储库的数据库记录的对应描述符。该操作还包括格式化对应的描述符以产生标准化的对应描述符,以及匹配每个标准化的对应描述符以产生该描述符的记录分数。该操作还包括组合标准化的对应描述符的记录分数以产生每条数据库记录的总分数,并基于总分数选择性地将每条数据库记录写入到数据存储库以编译数据库。
在一些示例中,每条数据库记录对应于临床试验研究者、与临床试验研究者对应的临床试验站点,或两者,并且该操作还包括使用空间聚类分析来产生地理聚类数据以确定在预期临床试验研究者的指定距离内的多个预期临床试验受试者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国控股实验室公司,未经美国控股实验室公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080028134.8/2.html,转载请声明来源钻瓜专利网。