[发明专利]一种结合序列生成和层级词表的医学概念自动编码方法有效
申请号: | 202110597714.5 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113033155B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 汤步洲;黄源航;熊英;陈清财 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/247;G06F40/295;G06F40/30 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 朱阳波 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 序列 生成 层级 词表 医学 概念 自动 编码 方法 | ||
本发明公开了提供了一种结合序列生成和层级词表的医学概念自动编码方法及装置,通过将临床医疗文本中的医学概念编码事件转变为序列生成问题,并引入层级词表的概念来增强医疗术语之间的关系,根据所述层级词表在进行序列生成的过程中准确地确定所述临床医疗文本对应的标准医学术语并进行自动编码。解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为标准医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。
技术领域
本发明涉及医学概念编码领域,尤其涉及的是一种结合序列生成和层级词表的医学概念自动编码方法。
背景技术
医学概念自动编码是医疗信息处理领域的一个重要研究方向。在医疗信息系统中,同一标准医学术语可能有多种不同的医学概念表达方式,这种表述方式的不统一和不准确现象严重阻碍了医疗大数据的整合、共享和利用,给医疗领域的临床、教学和科研带来了诸多不便。医学编码是一种数字和字母标签系统,它能够为每个诊断,症状或者症状组合等提供独特且统一的编码表示。目前医疗机构需要采用人工编码的方式将临床医疗文本中的医学概念手动映射为标准医学术语编码,而人工编码需要大量具有医学知识的专业人员进行操作,成本高昂,效率有限并且准确性不高。
因此,现有技术还有待改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种结合序列生成和层级词表的医学概念自动编码方法及装置,旨在解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为标准医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。
本发明解决问题所采用的技术方案如下:
第一方面,本发明实施例提供一种结合序列生成和层级词表的医学概念自动编码方法,其中,所述方法包括:
获取临床医疗文本,将所述临床医疗文本输入预设的编码器中,得到所述临床医疗文本的初始向量数据;
获取预先构建的层级词表数据,将所述层级词表数据输入预设的学习算法中,并获得所述层级词表的标准医学术语向量数据;
将所述临床医疗文本的初始向量数据和已经生成的所述标准医学术语向量数据输入预设的解码器中,依次生成若干个标准医学术语对应的编码数据,并根据所述编码数据形成所述临床医疗文本对应的编码数据。
在一种实施方式中,所述获取临床医疗文本,将所述临床医疗文本输入预设的编码器中,得到所述临床医疗文本的初始向量数据包括:
将临床医疗文本输入词嵌入层,通过所述词嵌入层对所述临床医疗文本进行映射后得到映射数据;
将所述映射数据输入到编码器,获取所述编码器基于所述映射数据编码生成的初始向量数据。
在一种实施方式中,所述获取预先构建的层级词表数据,将所述层级词典数据输入预设的学习算法中,并获得所述层级词表的标准医学术语向量数据包括:
获取术语词典数据中的标准医学术语数据的编码信息,根据所述编码信息将所述标准医学术语数据分为父节点和子节点;
获取所述父节点、所述子节点以及所述父节点与所述子节点之间的父子关系信息,根据所述父节点、所述子节点以及所述父节点与所述子节点之间的父子关系信息构建层级词表数据;
将所述层级词表数据输入预设的学习算法中,得到表示所述父节点、所述子节点以及所述父子关系信息的向量数据;
将表示所述父节点、所述子节点以及所述父子关系信息的向量数据作为所述层级词表的标准医学术语向量数据。
在一种实施方式中,所述编码信息包含字母段信息和数字段信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110597714.5/2.html,转载请声明来源钻瓜专利网。