[发明专利]临床术语标准化方法、装置、电子设备及存储介质在审
申请号: | 202110767577.5 | 申请日: | 2021-07-07 |
公开(公告)号: | CN113593661A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 尹珊珊;舒正;朱波;张骁雅;赵明;刘英杰 | 申请(专利权)人: | 青岛国新健康产业科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F16/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 谢志超 |
地址: | 266001 山东省青岛市自由贸易试验*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 临床 术语 标准化 方法 装置 电子设备 存储 介质 | ||
1.一种临床术语标准化方法,其特征在于,包括:
获取第一语句和多个第二语句;其中,所述第一语句为待识别语句,所述第二语句为标准临床术语;
将所述第一语句和多个第二语句输入预先训练好的S-Bert模型中,获取第一语句向量和多个第二语句向量;
将所述第一语句向量分别和所述多个第二语句向量进行相似度计算,将最高相似度值对应的第二语句作为所述第一语句对应的标准临床术语;
其中,所述S-Bert模型是基于样本语句对和样本类别标签训练得到的;其中,所述样本语句对包括待识别样本语句和多个标准临床术语;所述样本类别标签用于描述待识别样本语句与多个标准临床术语之间是否具有映射关系;
所述S-Bert模型用于对所述第一语句和第二语句进行语义符号序列的确定和池化处理。
2.根据权利要求1所述的临床术语标准化方法,其特征在于,所述S-Bert模型包括孪生神经网络结构和池化层,其中,
相应地,所述将所述第一语句和多个第二语句输入预先训练好的S-Bert模型中,获取第一语句向量和多个第二语句向量,包括:
将所述第一语句分别和所述多个第二语句中的任意一个构建句子对,得到多个句子对;
将所述多个句子对分别输入所述孪生神经网络结构中进行语义单元符号的确定以及符号处理,得到所述多个句子对各自的语义符号序列;
将所述多个句子对各自的语义符号序列分别输入所述池化层中进行平均池化、最大池化或起始符号位置池化处理,得到第一语句向量和多个第二语句向量。
3.根据权利要求2所述的临床术语标准化方法,其特征在于,所述符号处理包括:
在所述句子对前面添加预设起始符号;
和/或,
在所述句子对中相邻的两个句子之间添加预设分隔符号;
和/或,
为特殊语义单元符号添加特殊符号。
4.根据权利要求1所述的临床术语标准化方法,其特征在于,在所述获取第一语句和第二语句之前,根据样本语句对以及类别识别标签训练S-Bert模型,包括:
步骤S1、利用待训练的S-Bert模型对所述样本语句对中的第三语句和第四语句进行语义单元符号的确定以及符号处理,得到语义符号序列;其中,所述第三语句为所述待识别样本语句,所述第四语句为所述多个标准临床术语中的任意一个;
步骤S2、对所述语义符号序列进行平均池化、最大池化或起始符号位置池化处理,得到所述样本语句对的第三语句向量和第四语句向量;
步骤S3、对所述样本语句的第三语句向量和第四语句向量进行得分评估,选择分值最高的模型作为下一轮的待训练S-Bert模型;
步骤S4、对所述待训练S-Bert模型再次进行训练,当不满足模型训练终止条件时,调整所述待训练S-Bert模型,利用经过调整的S-Bert模型重新执行步骤S1;当满足模型训练终止条件时,得到经过训练的S-Bert模型。
5.根据权利要求4所述的临床术语标准化方法,其特征在于,所述调整所述待训练的S-Bert模型,包括:
根据所述样本语句对的第三语句向量和第四语句向量,得到差值向量;
将所述样本语句对的第三语句向量、第四语句向量和差值向量进行拼接处理,得到第五语句向量;
根据所述第五语句向量和训练权重值对所述待训练的S-Bert模型进行优化处理;
或,
对所述样本语句对的第三语句向量和第四语句向量进行余弦相似度的计算,获取余弦相似度值;
根据所述余弦相似度值以及所述样本语句对的类别标签中的分值对所述待训练的S-Bert模型进行优化处理;
或,
根据所述样本语句对的第三语句向量和第四语句向量与给定的语句向量之间的距离对所述待训练的S-Bert模型进行优化处理。
6.根据权利要求1所述的临床术语标准化方法,其特征在于,所述将所述第一语句向量分别和所述多个第二语句向量进行相似度计算,包括:
基于余弦相似度算法对所述第一语句向量分别和所述多个第二语句向量进行相似度计算,将最高相似度值对应的第二语句作为所述第一语句的标准临床术语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛国新健康产业科技有限公司,未经青岛国新健康产业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110767577.5/1.html,转载请声明来源钻瓜专利网。