[发明专利]电子病历实体关系抽取方法及装置有效

专利信息
申请号: 201610798932.4 申请日: 2016-08-31
公开(公告)号: CN106446526B 公开(公告)日: 2019-11-15
发明(设计)人: 黄亦谦 申请(专利权)人: 北京千安哲信息技术有限公司
主分类号: G16H50/70 分类号: G16H50/70
代理公司: 11447 北京英创嘉友知识产权代理事务所(普通合伙) 代理人: 王晓霞;魏嘉熹<国际申请>=<国际公布>
地址: 100026北京市朝阳区东*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开公开一种电子病历实体关系抽取方法及装置,属于医疗数据挖掘领域。该方法包括:通过卷积神经网络模型和词向量化表示,获取电子病历自然语句映射后的矩阵;将测试的电子病历自然语句输入至已训练的卷积神经网络模型,得到特征向量;将特征向量输入至已训练的分类器,抽取所述测试的电子病历自然语句的实体关系。这样,利用了卷积神经网络模型的优势,挖掘出电子病历自然语言中实体之间的关系,为自动学习电子病历信息提供了技术途径。
搜索关键词: 电子 病历 实体 关系 抽取 方法 装置
【主权项】:
1.一种电子病历实体关系抽取方法,其特征在于,所述方法包括:/n将每条电子病历自然语句的词都独立分割出来:/nWn={w1,w2,w3,…,wn}/n其中,Wn表示一条语句分割后的词向量,n表示语句中词的个数;/n将每个词映射为一个m维的向量;/n将映射后的所述每条电子病历自然语句表示为n×m的矩阵,其中,矩阵的列维数为m,行维数为所述词的个数n;/n将测试的电子病历自然语句输入至已训练的卷积神经网络模型,得到特征向量,在训练所述卷积神经网络模型时,对连续n个词的窗口进行打分f(wt-n+1,…,wt-1,wt),所述卷积神经网络模型的最小化目标函数为:/n /n其中,χ为训练语料中所有连续n元短语,D为包含所有单词的词典,x(w)表示将短语x中最中间的词随机替换成w;/n将所述特征向量输入至已训练的分类器,抽取所述测试的电子病历自然语句的实体关系,/n其中,在所述将测试的电子病历自然语句输入至已训练的卷积神经网络模型,得到特征向量的步骤之前,所述方法还包括:/n滑动卷积核,得到与映射后的所述电子病历自然语句的矩阵的卷积结果;/n根据所述卷积结果,经过最大池化层得到所述电子病历自然语句的特征;/n利用已有的电子病历训练集数据和所述特征,对所述卷积神经网络模型进行训练,得到卷积核参数和分类器参数,/n其中,所述利用已有的电子病历训练集数据和所述特征,对所述卷积神经网络模型进行训练,得到卷积核参数和分类器参数的步骤包括:/n选取已有的电子病历训练集数据,将所述已有的电子病历训练集数据的实体关系进行分类标注;/n根据所述分类标注和经过最大池化层得到的特征,训练所述卷积神经网络模型,得到卷积核参数和分类器参数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京千安哲信息技术有限公司,未经北京千安哲信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610798932.4/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top