[发明专利]电子病历实体关系抽取方法及装置有效
申请号: | 201610798932.4 | 申请日: | 2016-08-31 |
公开(公告)号: | CN106446526B | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 黄亦谦 | 申请(专利权)人: | 北京千安哲信息技术有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 11447 北京英创嘉友知识产权代理事务所(普通合伙) | 代理人: | 王晓霞;魏嘉熹<国际申请>=<国际公布> |
地址: | 100026北京市朝阳区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开公开一种电子病历实体关系抽取方法及装置,属于医疗数据挖掘领域。该方法包括:通过卷积神经网络模型和词向量化表示,获取电子病历自然语句映射后的矩阵;将测试的电子病历自然语句输入至已训练的卷积神经网络模型,得到特征向量;将特征向量输入至已训练的分类器,抽取所述测试的电子病历自然语句的实体关系。这样,利用了卷积神经网络模型的优势,挖掘出电子病历自然语言中实体之间的关系,为自动学习电子病历信息提供了技术途径。 | ||
搜索关键词: | 电子 病历 实体 关系 抽取 方法 装置 | ||
【主权项】:
1.一种电子病历实体关系抽取方法,其特征在于,所述方法包括:/n将每条电子病历自然语句的词都独立分割出来:/nWn={w1,w2,w3,…,wn}/n其中,Wn表示一条语句分割后的词向量,n表示语句中词的个数;/n将每个词映射为一个m维的向量;/n将映射后的所述每条电子病历自然语句表示为n×m的矩阵,其中,矩阵的列维数为m,行维数为所述词的个数n;/n将测试的电子病历自然语句输入至已训练的卷积神经网络模型,得到特征向量,在训练所述卷积神经网络模型时,对连续n个词的窗口进行打分f(wt-n+1,…,wt-1,wt),所述卷积神经网络模型的最小化目标函数为:/n /n其中,χ为训练语料中所有连续n元短语,D为包含所有单词的词典,x(w)表示将短语x中最中间的词随机替换成w;/n将所述特征向量输入至已训练的分类器,抽取所述测试的电子病历自然语句的实体关系,/n其中,在所述将测试的电子病历自然语句输入至已训练的卷积神经网络模型,得到特征向量的步骤之前,所述方法还包括:/n滑动卷积核,得到与映射后的所述电子病历自然语句的矩阵的卷积结果;/n根据所述卷积结果,经过最大池化层得到所述电子病历自然语句的特征;/n利用已有的电子病历训练集数据和所述特征,对所述卷积神经网络模型进行训练,得到卷积核参数和分类器参数,/n其中,所述利用已有的电子病历训练集数据和所述特征,对所述卷积神经网络模型进行训练,得到卷积核参数和分类器参数的步骤包括:/n选取已有的电子病历训练集数据,将所述已有的电子病历训练集数据的实体关系进行分类标注;/n根据所述分类标注和经过最大池化层得到的特征,训练所述卷积神经网络模型,得到卷积核参数和分类器参数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京千安哲信息技术有限公司,未经北京千安哲信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610798932.4/,转载请声明来源钻瓜专利网。
- 上一篇:用药规则信息相似度的处理方法
- 下一篇:用药信息的标识处理方法