[发明专利]一种面向医疗领域基于深度学习的命名实体识别方法在审
申请号: | 201711446980.8 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108170675A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 朱聪慧;赵铁军;关毅;李岳 | 申请(专利权)人: | 哈尔滨福满科技有限责任公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/08 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150001 黑龙江省哈尔滨*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种面向医疗领域基于深度学习的命名实体识别方法。该方法是通过一、利用医疗领域的有标注语料中的训练语料进行长短期记忆单元网络LSTM的训练;二、根据一中的更新的神经网络参数θ进行标注结果的路径查找,得到有标注语料的标注结果,利用命名实体识别评估标准F值对有标注语料中的测试语料的标注结果进行评估;三、在一中的训练过程中,先利用新闻领域的有标注语料进行长短期记忆单元网络LSTM的训练,再根据已经训好的模型和医疗领域的有标注语料,进行医疗领域的模型的训练,利用命名实体识别评估标准F值对有标注语料中的测试语料的标注结果进行评估等步骤实现的。本发明应用于命名实体识别领域。 1 | ||
搜索关键词: | 标注 语料 命名实体 医疗领域 测试语料 记忆单元 评估标准 神经网络参数 路径查找 训练过程 训练语料 评估 网络 学习 更新 应用 | ||
步骤一:利用无标注的医疗语料进行词向量veci的训练,获得补充医疗领域语料的词表voc和词表voc对应的词向量vec;vec=[vec1,vec2,…,vecn];voc=[voc1,voc2,…,vocn];其中i=1,2,…,n,n为无标注语料中的词种类总个数;
步骤二:利用新闻领域的有标注语料中的训练语料进行长短期记忆单元网络LSTM的训练;利用步骤一所述词向量vec作为所述长短期记忆单元网络LSTM的训练的预训练向量,利用LSTM方法根据所述预训练向量以及xk、yk计算优化目标利用梯度下降算法优化
进行LSTM的参数θC的更新;所述有标注语料包括训练语料和测试语料,最后得到LSTM的参数
其中,参数
为LSTM模型参数θC的在最终第n次迭代收敛时的数值,具体包括:WX_in、Wh_in、Wc_in、WX_o、Wh_o、Wc_o、WX_f、Wh_f、Wc_f、bin、bo或bf;其中:Wx_in:隐层输入门输入权值参数;Wh_in:隐层输入门状态输入权值参数;Wc_in:隐层记忆单元输入权值参数;Wx_o:隐层输出门输入权值参数;Wh_o:隐层输出门状态输入权值参数;Wc_o:隐层记忆单元输出层权值参数;Wx_f:隐层遗忘门输入权值参数;Wh_f:隐层遗忘门状态输入权值参数;Wc_f:隐层遗忘门记忆单元输入权值参数;bin:隐层输入门偏置参数;bo:隐层输出门偏置参数;bf:隐层遗忘门偏置参数;
其中,xk为第k个样例的有标注语料中的训练语料对应的LSTM输入的词序列;yk为第k个样例的有标注语料中的训练语料对应的标注结果向量;
步骤三:利用医学领域的有标注语料中的训练语料进行长短期记忆单元网络LSTM的训练;利用步骤一得到的词向量vec作为所述长短期记忆单元网络LSTM的训练的预训练向量,利用LSTM方法根据所述预训练向量以及xk、yk计算优化目标利用梯度下降算法优化
进行LSTM的参数θ的更新;所述有标注语料包括训练语料和测试语料;
其中,xk为第k个样例的有标注语料中的训练语料对应的LSTM输入的词序列;yk为第k个样例的有标注语料中的训练语料对应的标注结果向量;
步骤四:对参数更新后的LSTM进行测试,测试过程为:输入步骤二和步骤三所述有标注语料,根据步骤二中的更新的神经网络参数θC进行标注结果的路径查找,得到有标注语料的标注结果;利用命名实体识别评估标准F值对有标注语料中的测试语料的标注结果进行评估,并获得评估标注结果后的有标注预料,具体评估计算方法如下:
准确率=标注正确的实体词数/标注的实体词总数
召回率=标注正确的的实体词数/实体词总数
F值=2·准确率·召回率/(准确率+召回率)
步骤五、将有标注语料重复步骤二至步骤四,直至步骤四中所述命名实体识别评估标准F值不增加或重复步骤二和步骤四的次数达到最大值50~100次为止。
2.根据权利要求1所述命名实体识别方法,其特征在于,步骤二所述LSTM的参数θC的更新的具体步骤如下:步骤二一:将词表voc和词表voc对应的词向量vec进行预训练;利用xk和步骤一中获得的词向量vec来计算得到LSTM神经网络的输入序列X其中,X=X1,X2,...,Xt,...,XT;
步骤二二:利用输入Xt、第t‑1次计算得到的隐层ht‑1和第t‑1次计算得到的记忆单元ct‑1计算第t次计算的LSTM模型的输入门int、LSTM模型的输出门ot以及LSTM模型的遗忘门ft;根据int、ot和ft计算得到记忆单元值ct和隐层值ht;其中,隐层值ht的具体模型为:ht=otgtanh(ct);
步骤二三:将步骤二一所述输入序列X=X1,X2,...,Xt,...,XT内部的各个元素按从X1到XT的顺序依次输入到步骤二二所述隐层值ht的具体模型中并获得隐层遗忘门输出hf;然后,将步骤二一所述输入序列X=X1,X2,...,Xt,...,XT内部的各个元素按从XT到X1的顺序依次输入到步骤二二所述隐层值h
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨福满科技有限责任公司,未经哈尔滨福满科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711446980.8/,转载请声明来源钻瓜专利网。
- 上一篇:词性标注方法和装置、程序产品及存储介质
- 下一篇:故事创作的方法、系统和终端