[发明专利]一种医疗命名实体一词多标的识别方法、装置及电子设备在审

专利信息
申请号: 202110617009.7 申请日: 2021-06-02
公开(公告)号: CN113191151A 公开(公告)日: 2021-07-30
发明(设计)人: 张瀚之;刘升平;梁家恩 申请(专利权)人: 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30;G06F40/126;G06F40/117;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 100096 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 医疗 命名 实体 一词多 标的 识别 方法 装置 电子设备
【说明书】:

本公开涉及一种医疗命名实体一词多标的识别方法、装置及电子设备,涉及深度学习技术领域,包括:对待识别文本进行细粒度分词;对所述细粒度分词进行信息融合,得到编码词向量;根据所述编码词向量输出所述待识别文本对应的识别信息。本发明可以使中文细粒度词拥有融合上下文信息的作用,能够解决医疗领域命名实体的一词多标问题。

技术领域

本公开实施例涉及深度学习技术领域,更具体地,涉及一种医疗命名实体一词多标的识别方法、装置及电子设备。

背景技术

序列标记问题作为NLP的基本问题,其标签预测的结果对于后续任务有着至关重要的影响。此外,自然语言处理中的许多任务也均能转化为序列标记问题,如命名实体识别、分词、词性标注等。

但是在医疗领域的命名实体的识别过程中常会遇到一词多标的问题,如葡萄糖这个词,在“患者低血糖注射葡萄糖溶液治疗”中是和“溶液”一起标为药品,在“患者查血:葡萄糖5.73mmol/L”中则单独标为检查指标,“患者运动后自饮葡萄糖水”中则不标,词的语义并没有明显变化但在不同的语境下对应的标签是不同的。

虽然现有解决序列标记问题的LSTM模型可以一定程度上的处理一字多义,但是LSTM模型是以字级别进行编码,在编码过程中的最小编码单元为一个字,是对字级别进行词向量编码,而对于医疗领域常见的词级别的一词多标无法很好地解决。

发明内容

本公开实施例的一个目的是提供一种医疗命名实体一词多标的识别方法、装置及电子设备,以解决现有命名实体的识别模型对于词级别的一词多标效果较差的问题。

根据本公开的第一方面,提供了一种医疗命名实体一词多标的识别方法,包括:对待识别文本进行细粒度分词;对所述细粒度分词进行信息融合,得到编码词向量;根据所述编码词向量输出所述待识别文本对应的识别信息。

进一步地,所述对待识别文本进行细粒度分词,包括:利用二元语法模型以及命名实体词库对所述待识别文本进行细粒度分词,将所述待识别文本拆分为多个单元词组;其中,每一单元词组最少包含一个字。

进一步地,所述命名实体词库包括医疗专业知识库。

进一步地,对所述细粒度分词进行信息融合,得到编码词向量,包括:利用字符级语言模型将每一所述细粒度分词映射到向量空间,得到对应于每个细粒度分词的编码词向量。

进一步地,将所述细粒度分词映射到向量空间即对该分词进行信息融合,包括:对每个单元词组的尾字前向隐藏状态和首字后向隐藏状态进行拼接,以融合每个细粒度分词在语境中的信息和每个细粒度分词本身的信息。

进一步地,根据所述编码词向量输出所述待识别文本对应的识别信息,包括:利用序列标记模型对所述编码词向量进行标记,输出对每个编码词向量的标签预测。

根据本公开的第二方面,还提供了一种医疗命名实体一词多标的识别装置,包括:分词模块,用于对待识别文本进行细粒度分词;编码词向量模块,用于对所述细粒度分词进行信息融合,得到编码词向量;识别模块,用于根据所述编码词向量输出所述待识别文本对应的识别信息。

根据本公开的第三方面,还提供了一种电子设备,包括存储器和处理器,所述存储器用于存储计算机程序;所述处理器用于执行所述计算机程序,以实现根据本公开第一方面所述的方法。

根据本公开的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序在被处理器执行时实现根据本公开的第一方面所述的方法。

本公开实施例的一个有益效果在于,本发明实施例使用二元语法模型融合医疗专业知识库,对文本先进行细粒度分词,再对细粒度分词进行信息融合,得到编码词向量,使中文的细粒度词拥有了融合上下文信息和词组本身内部信息的作用,能够解决医疗领域的一词多标问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110617009.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top