[发明专利]命名实体识别方法、装置、设备及计算机可读存储介质有效
申请号: | 201810332490.3 | 申请日: | 2018-04-13 |
公开(公告)号: | CN108536679B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 晁阳;李东;陆遥 | 申请(专利权)人: | 腾讯科技(成都)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 刘映东 |
地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 识别 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明实施例公开了一种命名实体识别方法、装置、设备及计算机可读存储介质。方法包括:获取待识别文本的字符向量和词向量,对字符向量和词向量进行加权求和,得到加权求和结果;将加权求和结果输入至目标双向LSTM模型中进行处理,得到文本特征序列;将文本特征序列输入至目标CRF模型中进行处理,得到待识别文本的命名实体识别结果。获取待识别文本的字符向量和词向量之后,通过对字符向量和词向量进行加权求和,更好的利用了动态的权重信息,通过采用双向LSTM模型更充分的考虑了上下文词与词的关系,充分利用了双向信息,再结合CRF模型进行处理,从而提高了命名实体识别的准确率。
技术领域
本发明实施例涉及互联网技术领域,特别涉及一种命名实体识别方法、装置、设备及计算机可读存储介质。
背景技术
在信息抽取、实体链接等自然语言处理任务的场景中,常常需要进行NER(NamedEntity Recognition,命名实体识别)。其中,NER是指在文档集合中识别出特定类型的事物名称或符号的过程。
相关技术在进行命名实体识别时,一般采用CRF(Conditional Random Field,条件随机场算法)或单向RNN(Recurrent neural Network、循环神经网络)等模型对待识别文本进行识别。
然而,由于无论采用CRF还是采用单向RNN进行识别,得到的语义信息比较有限,因此,识别的准确率不高。
发明内容
本发明实施例提供了一种命名实体识别方法、装置、设备及计算机可读存储介质,可用于解决相关技术中的问题。所述技术方案如下:
一方面,本发明实施例提供一种命名实体识别方法,所述方法包括:
获取待识别文本的字符向量和词向量,对所述字符向量和词向量进行加权求和,得到加权求和结果;
将所述加权求和结果输入至目标Bi-LSTM(Bi-directional Long Short-TermMemory,双向长短期记忆)模型中进行处理,得到文本特征序列;
将所述文本特征序列输入至目标CRF(Conditional Random Field,条件随机场)模型中进行处理,得到所述待识别文本的命名实体识别结果。
一方面,提供了一种命名实体识别装置,所述装置包括:预处理层、双向LSTM层和CRF层;
所述预处理层,用于获取待识别文本的字符向量和词向量,对所述字符向量和词向量进行加权求和,得到加权求和结果,将所述加权求和结果输入至所述双向LSTM层;
所述双向LSTM层,用于对所述加权求和结果进行处理,得到文本特征序列,将所述文本特征序列输入至所述CRF层;
所述CRF层,用于对所述文本特征序列进行处理,得到所述待识别文本的命名实体识别结果。
一方面,提供了一种命名实体识别装置,所述装置包括:
预处理模块,用于获取待识别文本的字符向量和词向量,对所述字符向量和词向量进行加权求和,得到加权求和结果;
第一处理模块,用于将所述加权求和结果输入至目标双向LSTM模型中进行处理,得到文本特征序列;
第二处理模块,用于将所述文本特征序列输入至目标CRF模型中进行处理,得到所述待识别文本的命名实体识别结果。
一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被所述处理器执行时实现上述的命名实体识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(成都)有限公司,未经腾讯科技(成都)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810332490.3/2.html,转载请声明来源钻瓜专利网。