[发明专利]医疗数据管理查询方法有效
| 申请号: | 202310397351.X | 申请日: | 2023-04-14 |
| 公开(公告)号: | CN116108000B | 公开(公告)日: | 2023-06-20 |
| 发明(设计)人: | 胡其桐;李睿;刘瑞华;邢沛瑶;郑名扬;唐学文 | 申请(专利权)人: | 成都安哲斯生物医药科技有限公司 |
| 主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/25;G06F16/28;G16H40/20 |
| 代理公司: | 成都信捷同创知识产权代理事务所(普通合伙) 51323 | 代理人: | 左正超 |
| 地址: | 610200 四川省成都市天*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 医疗 数据管理 查询 方法 | ||
1.一种医疗数据管理查询方法,其特征在于,包括数据库构建流程和搜索查询流程;
数据库构建流程包括以下步骤:
S11、采集医疗数据,将采集的医疗数据进行自然文本信息和非文本信息的分类;
S12、对非文本信息进行标准化处理后写入数据库;对自然文本信息进行关键词提取,若提取的关键词信息格式为名称和数量,则对名称进行标准化处理,并将标准化后的名称和数量写入数据库;若提取的关键词信息格式为名称和性质,则对名称进行标准化处理,对性质进行二元分类处理,并将标准化后的名称和二元分类后的性质写入数据库;
搜索查询流程包括以下步骤:
S21、对输入的查询字段进行自然文本输入和标准化文本输入的分类;
S22、通过标准化文本输入在数据库中进行查找并返回查询结果;对自然文本输入进行关键词提取,若提取的关键词信息格式为名称和数量,则对名称进行标准化处理,得到标准化后的名称和数量,利用知识图谱判断需要被查找的字段,得到被查找的字段和条件;若提取的关键词信息格式为名称和性质,则对名称进行标准化处理,对性质进行二元分类处理,得到标准化后的名称和二元分类后的性质,利用知识图谱判断需要被查找的字段,得到被查找的字段和条件;通过被查找的字段和条件在数据库中进行查找并返回查询结果;
关键词提取包括步骤:优化后的StructBERT模型将文本基于上下文信息转化为词向量,并做初始化处理;将初始化处理后的结果导入LSTM模型;将LSTM模型的输出导入CRF模型,输出为最终的文本类别;
优化后的StructBERT模型由对StructBERT模型进行segmentation预处理和fist-last-selection处理后得到;
segmentation预处理包括:在运行StructBERT模型前,进行Segment文本分割操作,将文本中的医学专有名词进行整体性分割,并令分词器将医学专有名词整体转化为向量;fist-last-selection处理包括:在运行StructBERT模型后,只选取StructBERT模型的首层参数和末层参数作为输出结果。
2.根据权利要求1所述的医疗数据管理查询方法,其特征在于:步骤S11中,采集医疗数据后,利用全局标识符对医疗数据进行整理,采取面向对象的构建方式,以单个病人为存储单元,并且允许数据回写。
3.根据权利要求1所述的医疗数据管理查询方法,其特征在于:步骤S12采用二元分类器对性质进行二元分类处理,二元分类器采用StructBERT-Softmax算法,StructBERT-Softmax算法包括StructBERT模型和Softmax操作。
4.根据权利要求1所述的医疗数据管理查询方法,其特征在于:标准化处理包括步骤:优化后的StructBERT模型将文本基于上下文信息转化为词向量,并做初始化处理;将初始化处理后的结果导入优化后的PCA模型进行主成分提取,得到简化后的掩码向量;将优化后的PCA模型的输出导入Clustering模型进行聚类;
优化后的StructBERT模型由对StructBERT模型进行segmentation预处理和fist-last-selection处理后得到;优化后的PCA模型中选取协方差矩阵前k个特征值对应特征向量所构成的投影矩阵X。
5.根据权利要求4所述的医疗数据管理查询方法,其特征在于:segmentation预处理包括:在运行StructBERT模型前,进行Segment文本分割操作,将文本中的医学专有名词进行整体性分割,并令分词器将医学专有名词整体转化为向量;fist-last-selection处理包括:在运行StructBERT模型后,只选取StructBERT模型的首层参数和末层参数作为输出结果。
6.根据权利要求1所述的医疗数据管理查询方法,其特征在于:步骤S12中,非文本信息进行标准化处理后作为原有数据写入数据库,标准化后的名称和数量以及标准化后的名称和二元分类后的性质均作为文本数据写入数据库;
步骤S22中,通过标准化文本输入在数据库中进行查找时或者通过被查找的字段和条件在数据库中进行查找时,先在数据库的原有数据中进行查找,寻找到结果则返回结果,否则在数据库的文本数据中进行查找,若寻找到结果则返回结果,否则返回错误。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都安哲斯生物医药科技有限公司,未经成都安哲斯生物医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310397351.X/1.html,转载请声明来源钻瓜专利网。





