[发明专利]实体链接方法、装置、存储介质及电子设备在审

专利信息
申请号: 201811330154.1 申请日: 2018-11-09
公开(公告)号: CN109522551A 公开(公告)日: 2019-03-26
发明(设计)人: 刘旭;刘学梁;王琛;季思伟 申请(专利权)人: 天津新开心生活科技有限公司;天津开心生活科技有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/28;G06F16/36;G16H15/00
代理公司: 北京律智知识产权代理有限公司 11438 代理人: 袁礼君;阚梓瑄
地址: 300467 天津市滨海新区天津生态城国*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 链接 词条 候选集合 语义 电子设备 计算机可读存储介质 表达方式 存储介质 链接装置 匹配特征 医学术语 语义识别 准确率 预设 数据库 文本 筛选 医疗
【说明书】:

本公开涉及一种实体链接方法、实体链接装置、计算机可读存储介质及电子设备,实体链接方法包括:从医疗文本中提取待链接实体;在标准词条数据库中筛选得到与所述待链接实体具有匹配特征的标准词条的候选集合;通过预设模型为所述候选集合中的各个标准词条提供语义相关性评分;将所述待链接实体链接至所述候选集合中的语义相关性评分最高的标准词条。本公开通过对临床中具有不同表达方式的医学术语进行语义识别以将待链接实体链接至最接近的标准词条,提高了实体链接方法的效率和准确率。

技术领域

本公开涉及数据处理技术领域,具体涉及一种实体链接方法、实体链接装置、计算机可读存储介质及电子设备。

背景技术

在临床病历大数据的处理中,由于地域、医院、医生、标准等差异,同一实体往往有大量不同的表达方式,只有精确地识别出同一种实体,针对有限的实体空间,才能有效的对数据进行统计和计算。因此,医学术语实体链接是数据处理过程中一个必不可少的部分。

现有的实体链接方法一般是通过分类等算法降低候选数量,然后通过相似度计算得到最接近的候选。作为现有实体链接系统的核心算法,相似度计算一般是通过建模事物特征,将特征转化为向量,再通过计算向量距离来衡量相似的程度。

在现有的实体链接方法中,一般需要大量的标注语料,而专业的医学知识难以加入到特征中用于计算。另外,基于相似度计算的实体链接方法可以很好的处理候选差异较大的情况,但是在面对候选相近的情况时通常很难处理。尤其是基于神经网络的算法,不能很好地利用医学相关知识,算法的计算过程也无法解释。因此,在针对医学领域的大数据处理中,亟需一种医学术语实体链接方法,以解决上述问题。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种实体链接方法、实体链接装置、计算机可读存储介质及电子设备,进而至少在一定程度上解决由于相关技术的限制和缺陷而导致的处理难度大、可解释性差、成本高以及难以管理和使用专业医学知识等技术问题。

根据本公开的一个方面,提供一种实体链接方法,其特殊之处在于,包括:

从医疗文本中提取待链接实体;

在标准词条数据库中筛选得到与所述待链接实体具有匹配特征的标准词条的候选集合;

通过预设模型为所述候选集合中的各个标准词条提供语义相关性评分;

将所述待链接实体链接至所述候选集合中的语义相关性评分最高的标准词条。

在本公开的一种示例性实施例中,所述在标准词条数据库中筛选得到与所述待链接实体具有匹配特征的标准词条的集合包括:

对所述待链接实体进行分词处理得到一个或者多个分词单元;

在标准词条数据库中筛选得到与所述待链接实体的分词单元具有匹配特征的标准词条的集合。

在本公开的一种示例性实施例中,在步骤在标准词条数据库中筛选得到与所述待链接实体具有匹配特征的标准词条的候选集合之后,所述方法还包括:

在所述标准词条的候选集合中通过语义分析滤除与所述待链接实体语义不符的标准词条。

在本公开的一种示例性实施例中,在所述标准词条的候选集合中通过语义分析滤除与所述待链接实体语义不符的标准词条包括:

对所述待链接实体进行语义角色标注,得到核心语义特征;

通过比较所述核心语义特征,在所述标准词条的候选集合中滤除与所述待链接实体语义不符的标准词条。

在本公开的一种示例性实施例中,所述比较所述核心语义特征包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津新开心生活科技有限公司;天津开心生活科技有限公司,未经天津新开心生活科技有限公司;天津开心生活科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811330154.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top