[发明专利]一种面向医疗领域基于深度学习的命名实体识别方法在审

专利信息
申请号: 201711446980.8 申请日: 2017-12-27
公开(公告)号: CN108170675A 公开(公告)日: 2018-06-15
发明(设计)人: 朱聪慧;赵铁军;关毅;李岳 申请(专利权)人: 哈尔滨福满科技有限责任公司
主分类号: G06F17/27 分类号: G06F17/27;G06N3/08
代理公司: 哈尔滨市阳光惠远知识产权代理有限公司 23211 代理人: 刘景祥
地址: 150001 黑龙江省哈尔滨*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种面向医疗领域基于深度学习的命名实体识别方法。该方法是通过一、利用医疗领域的有标注语料中的训练语料进行长短期记忆单元网络LSTM的训练;二、根据一中的更新的神经网络参数θ进行标注结果的路径查找,得到有标注语料的标注结果,利用命名实体识别评估标准F值对有标注语料中的测试语料的标注结果进行评估;三、在一中的训练过程中,先利用新闻领域的有标注语料进行长短期记忆单元网络LSTM的训练,再根据已经训好的模型和医疗领域的有标注语料,进行医疗领域的模型的训练,利用命名实体识别评估标准F值对有标注语料中的测试语料的标注结果进行评估等步骤实现的。本发明应用于命名实体识别领域。 1
搜索关键词: 标注 语料 命名实体 医疗领域 测试语料 记忆单元 评估标准 神经网络参数 路径查找 训练过程 训练语料 评估 网络 学习 更新 应用
【主权项】:
1.一种面向医疗领域基于深度学习的命名实体识别方法,其特征在于,该方法的具体步骤如下:

步骤一:利用无标注的医疗语料进行词向量veci的训练,获得补充医疗领域语料的词表voc和词表voc对应的词向量vec;vec=[vec1,vec2,…,vecn];voc=[voc1,voc2,…,vocn];其中i=1,2,…,n,n为无标注语料中的词种类总个数;

步骤二:利用新闻领域的有标注语料中的训练语料进行长短期记忆单元网络LSTM的训练;利用步骤一所述词向量vec作为所述长短期记忆单元网络LSTM的训练的预训练向量,利用LSTM方法根据所述预训练向量以及xk、yk计算优化目标利用梯度下降算法优化进行LSTM的参数θC的更新;所述有标注语料包括训练语料和测试语料,最后得到LSTM的参数其中,参数为LSTM模型参数θC的在最终第n次迭代收敛时的数值,具体包括:WX_in、Wh_in、Wc_in、WX_o、Wh_o、Wc_o、WX_f、Wh_f、Wc_f、bin、bo或bf;其中:Wx_in:隐层输入门输入权值参数;Wh_in:隐层输入门状态输入权值参数;Wc_in:隐层记忆单元输入权值参数;Wx_o:隐层输出门输入权值参数;Wh_o:隐层输出门状态输入权值参数;Wc_o:隐层记忆单元输出层权值参数;Wx_f:隐层遗忘门输入权值参数;Wh_f:隐层遗忘门状态输入权值参数;Wc_f:隐层遗忘门记忆单元输入权值参数;bin:隐层输入门偏置参数;bo:隐层输出门偏置参数;bf:隐层遗忘门偏置参数;

其中,xk为第k个样例的有标注语料中的训练语料对应的LSTM输入的词序列;yk为第k个样例的有标注语料中的训练语料对应的标注结果向量;

步骤三:利用医学领域的有标注语料中的训练语料进行长短期记忆单元网络LSTM的训练;利用步骤一得到的词向量vec作为所述长短期记忆单元网络LSTM的训练的预训练向量,利用LSTM方法根据所述预训练向量以及xk、yk计算优化目标利用梯度下降算法优化进行LSTM的参数θ的更新;所述有标注语料包括训练语料和测试语料;

其中,xk为第k个样例的有标注语料中的训练语料对应的LSTM输入的词序列;yk为第k个样例的有标注语料中的训练语料对应的标注结果向量;

步骤四:对参数更新后的LSTM进行测试,测试过程为:输入步骤二和步骤三所述有标注语料,根据步骤二中的更新的神经网络参数θC进行标注结果的路径查找,得到有标注语料的标注结果;利用命名实体识别评估标准F值对有标注语料中的测试语料的标注结果进行评估,并获得评估标注结果后的有标注预料,具体评估计算方法如下:

准确率=标注正确的实体词数/标注的实体词总数

召回率=标注正确的的实体词数/实体词总数

F值=2·准确率·召回率/(准确率+召回率)

步骤五、将有标注语料重复步骤二至步骤四,直至步骤四中所述命名实体识别评估标准F值不增加或重复步骤二和步骤四的次数达到最大值50~100次为止。

2.根据权利要求1所述命名实体识别方法,其特征在于,步骤二所述LSTM的参数θC的更新的具体步骤如下:

步骤二一:将词表voc和词表voc对应的词向量vec进行预训练;利用xk和步骤一中获得的词向量vec来计算得到LSTM神经网络的输入序列X其中,X=X1,X2,...,Xt,...,XT

步骤二二:利用输入Xt、第t‑1次计算得到的隐层ht‑1和第t‑1次计算得到的记忆单元ct‑1计算第t次计算的LSTM模型的输入门int、LSTM模型的输出门ot以及LSTM模型的遗忘门ft;根据int、ot和ft计算得到记忆单元值ct和隐层值ht;其中,隐层值ht的具体模型为:ht=otgtanh(ct);

步骤二三:将步骤二一所述输入序列X=X1,X2,...,Xt,...,XT内部的各个元素按从X1到XT的顺序依次输入到步骤二二所述隐层值ht的具体模型中并获得隐层遗忘门输出hf;然后,将步骤二一所述输入序列X=X1,X2,...,Xt,...,XT内部的各个元素按从XT到X1的顺序依次输入到步骤二二所述隐层值h

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨福满科技有限责任公司,未经哈尔滨福满科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711446980.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top