[发明专利]临床术语标准化方法、装置、电子设备及存储介质在审
申请号: | 202110767577.5 | 申请日: | 2021-07-07 |
公开(公告)号: | CN113593661A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 尹珊珊;舒正;朱波;张骁雅;赵明;刘英杰 | 申请(专利权)人: | 青岛国新健康产业科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F16/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 谢志超 |
地址: | 266001 山东省青岛市自由贸易试验*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 临床 术语 标准化 方法 装置 电子设备 存储 介质 | ||
本发明提供一种临床术语标准化方法、装置、电子设备及存储介质,方法包括:获取第一语句和多个第二语句;其中,所述第一语句为待识别语句,所述第二语句为标准临床术语;将所述第一语句和多个第二语句输入预先训练好的S‑Bert模型中,获取第一语句向量和第二语句向量;对所述第一语句向量和第二语句向量进行相似度计算,将最高相似度值对应的第二语句作为所述第一语句对应的标准临床术语。本发明提供的方法能够提高临床术语标准化的准确率和效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种临床术语标准化方法、装置、电子设备及存储介质。
背景技术
随着医疗信息化的高速发展,医疗数据的类型和规模也在快速增长。显然,对多家医疗数据中心(简称“多中心”)的医疗数据进行数据分析挖掘,为临床决策、医疗管理服务及科学研究等提供支持成为必然趋势。
目前,国内医疗术语相关标准匮乏,体系尚不完整,加上医疗信息系统厂商众多,导致医疗数据中心间甚至医疗数据中心内的术语名称与编码的异构现象十分严重,而且还存在大量的半结构化和非结构化数据,大量分布式的异构数据、信息、仪器设备和系统,给医疗信息的表达、存储、交换、共享、系统协同工作带来了诸多障碍。若要实现医疗的数字化、信息化,实现高效率的全社会医疗资源共享、跨区域医疗以及跨系统医疗,无疑需要一套标准的临床医学术语。但目前国际上现有的标准临床术语集之间的映射关系由于语言壁垒导致很难应用于国内医疗术语的标准话,难以实现多医疗数据中心之间医疗数据的标准化与共用共享。
现有技术中,对于数据标准化处理多采用经验规则,在经过简单处理后仍然需要较多的人工复核,相关映射人员工作量大效率低下,而且映射关系的准确率不高。
发明内容
本发明提供一种临床术语标准化方法、装置、电子设备及存储介质,用以解决现有技术中标准化处理采用经验规则、人工复核的方式导致映射效率低下和准确率不高的技术问题,实现提高临床术语标准化处理的准确率和效率的目的。
第一方面,本发明提供一种临床术语标准化方法,包括:
获取第一语句和多个第二语句;其中,所述第一语句为待识别语句,所述第二语句为标准临床术语;
将所述第一语句和多个第二语句输入预先训练好的S-Bert模型中,获取第一语句向量和多个第二语句向量;
将所述第一语句向量分别和所述多个第二语句向量进行相似度计算,将最高相似度值对应的第二语句作为所述第一语句对应的标准临床术语;
其中,所述S-Bert模型是基于样本语句对和样本类别标签训练得到的;其中,所述样本语句对包括待识别样本语句和多个标准临床术语;所述样本类别标签用于描述待识别样本语句与多个标准临床术语之间是否具有映射关系;
所述S-Bert模型用于对所述第一语句和第二语句进行语义符号序列的确定和池化处理。
根据本发明提供的临床术语标准化方法,所述S-Bert模型包括孪生神经网络结构和池化层,其中,
相应地,所述将所述第一语句和多个第二语句输入预先训练好的S-Bert模型中,获取第一语句向量和多个第二语句向量,包括:
将所述第一语句分别和所述多个第二语句中的任意一个构建句子对,得到多个句子对;
将所述多个句子对分别输入所述孪生神经网络结构中进行语义单元符号的确定以及符号处理,得到所述多个句子对各自的语义符号序列;
将所述多个句子对各自的语义符号序列分别输入所述池化层中进行平均池化、最大池化或起始符号位置池化处理,得到第一语句向量和多个第二语句向量。
根据本发明提供的临床术语标准化方法,所述符号处理包括:
在所述句子对前面添加预设起始符号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛国新健康产业科技有限公司,未经青岛国新健康产业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110767577.5/2.html,转载请声明来源钻瓜专利网。