[发明专利]临床试验数据结构化方法、临床试验推荐方法和装置有效
| 申请号: | 202110173871.3 | 申请日: | 2021-02-09 | 
| 公开(公告)号: | CN112908436B | 公开(公告)日: | 2022-03-11 | 
| 发明(设计)人: | 任科;牛梓权;苏航;孙宗韬;汝玲 | 申请(专利权)人: | 上海药明津石医药科技有限公司 | 
| 主分类号: | G16H10/20 | 分类号: | G16H10/20;G16H70/40;G06F40/284 | 
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 关志琨 | 
| 地址: | 200010 上海市黄浦区*** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 临床试验 数据结构 方法 推荐 装置 | ||
1.一种临床试验数据结构化方法,其特征在于,所述方法包括:
接收临床试验对应的招募文本数据,所述招募文本数据中包含临床试验的入排标准信息;
对所述招募文本数据进行向量化,得到所述招募文本数据中每条入排标准信息对应的向量化结果;
根据每条入排标准信息对应的所述向量化结果,在临床试验数据结构化决策列表中进行匹配,得到所述向量化结果对应的结构化字段,并根据所述结构化字段在所述招募文本数据中抓取结构化字段值;
其中,所述临床试验数据结构化决策列表的建立过程包括:
获取临床试验招募文本数据样本,所述临床试验招募文本数据样本中包含多条临床试验招募文本数据,每一条所述临床试验招募文本数据中包含一项临床试验的至少一条入排标准信息;
根据预设的自然语言处理模型对所述临床试验招募文本数据样本中的每一条临床试验招募文本数据进行向量化处理,得到对应的向量化结果;
根据基准向量,对所述向量化结果进行分类处理,得到分组的向量化结果;所述每一分组的向量化结果表征一种类型的入排标准的向量化值范围;
接收标注信息,根据所述标注信息确定所述每一分组的向量化结果对应的结构化字段;
根据所述结构化字段,对所述每一条临床试验招募文本数据中的入排标准提取对应的结构化字段值,并按照发布时间顺序将所述每一条临床试验招募文本数据以入排标准为结构化字段和结构化字段值的形式,生成所述临床试验数据结构化决策列表。
2.根据权利要求1所述的方法,其特征在于,基于疾病类型对应有不同的临床试验招募文本数据样本;所述获取临床试验招募文本数据样本,包括:
获取多种疾病类型对应的临床试验招募文本数据;每一疾病类型对应有多条临床试验招募文本数据;
提取所述每一疾病类型中每一条临床试验招募文本数据中对应的疾病细分特征;
根据所述每一疾病类型、所述疾病细分特征与对应的所述临床试验招募文本数据三者建立关联关系,得到所述每一疾病类型的临床试验招募文本数据初始样本;
合并所述每一疾病类型的临床试验招募文本数据初始样本,得到临床试验招募文本数据样本。
3.根据权利要求1所述的方法,其特征在于,所述预设的自然语言处理模型包括词向量模型;所述根据预设的自然语言处理模型对所述临床试验招募文本数据样本中的每一条临床试验招募文本数据进行向量化处理,得到对应的向量化结果,包括:
根据预设的分句切分标识,对所述临床试验招募文本数据样本中每一条所述临床试验招募文本数据进行切分处理,得到分句切分结果;
根据词向量模型对每一所述分句切分结果进行分词识别和分词向量化,得到对应的词向量化结果;
针对每一所述分句切分结果对应的词向量化结果进行加权计算,得到所述分句切分结果对应的分句向量化结果。
4.根据权利要求1所述的方法,其特征在于,所述向量化结果包括分句向量化结果;所述根据基准向量,对所述向量化结果进行分类处理,得到分组的向量化结果;所述每一分组的向量化结果表征一种类型的入排标准的向量化值范围,包括:
计算所述每一条临床试验招募文本数据中每一入排标准信息对应的所述分句向量化结果与任一基准向量间的相似度,得到所述分句向量化结果与任一所述基准向量间的相似度值;
根据预设的相似度阈值,将与同一所述基准向量间的相似度值满足预设相似度阈值的分句向量化结果划分为同一类,得到分组的向量化结果;所述每一分组的向量化结果表征一种类型的入排标准的向量化值范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海药明津石医药科技有限公司,未经上海药明津石医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110173871.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:分体式帆板
- 下一篇:一种空调热平衡试验室节能控制方法及系统





