[发明专利]命名实体的识别方法和装置、存储介质、电子装置在审
申请号: | 202011279896.3 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112417874A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 唐光远;李卓茜;陈海波;罗琴;张俊杰;李润静 | 申请(专利权)人: | 珠海格力电器股份有限公司;珠海联云科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 吴大建;金淼 |
地址: | 519000*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 识别 方法 装置 存储 介质 电子 | ||
本申请公开了一种命名实体的识别方法和装置、存储介质、电子装置。其中,该方法包括:获取目标文本,其中,所述目标文本为待提取命名实体的文本;利用所述目标文本的双向语义表征得到所述目标文本中的命名实体,用深度学习方法,提高命名实体识别准确率。本申请解决了相关技术中命名实体的提取准确度较低的技术问题。
技术领域
本申请涉及人工智能领域,具体而言,涉及一种命名实体的识别方法和装置、存储介质、电子装置。
背景技术
命名实体识别是信息抽取以及自然语言处理领域的一项基本且重要的任务。在现代的信息社会中,通常人们会从一段新闻或者文字中获取自己需要的且重要的信息,所以这个时候,命名实体识别技术就显得十分重要,能帮助我们很快的从文本中检索出我们需要的信息。一般来说,命名实体识别主要识别包括人名、组织机构名、地名、时间等等。NER(命名实体识别)可以从很多非结构化的文本中抽取出上述实体,并且它还可以可以识别出更多种类的实体,所以实体这里是根据业务需求定义的。
目前,中文命名实体识别效果相对于英文来说,效果并不是很好,因为中文识别的相比英文有一定难度。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种命名实体的识别方法和装置、存储介质、电子装置,以至少解决相关技术中命名实体的提取准确度较低的技术问题。
根据本申请实施例的一个方面,提供了一种命名实体的识别方法,包括:获取目标文本,其中,所述目标文本为待提取命名实体的文本;利用所述目标文本的双向语义表征得到所述目标文本中的命名实体。
可选地,在利用所述目标文本的双向语义表征得到所述目标文本中的命名实体包括进行如下处理时,利用BERT语义表征层对所述目标文本进行语义编码,输入到BiLSTM层进行解码,输出到注意力机制层获得注意力权重,通过CRF层优化注意力层传递来的序列信息。
可选地,在利用BERT语义表征层对所述目标文本进行语义编码时,将所述目标文本通过文本输入层输入至BERT语义表征层;在所述BERT语义表征层利用BERT模型将所述目标文本中的词语进行语义编码,得到所述目标文本中词语的词向量。
可选地,在输入到BiLSTM层进行解码时,将所述目标文本中词语的词向量输入BiLSTM层来融合上下文特征的信息,得到文本特征向量。
可选地,在输出到注意力机制层获得注意力权重时,将BiLSTM层的输出的文本特征向量输入到注意力机制层;通过所述注意力机制层确定所述目标文本中关键词的注意力权重。
可选地,在通过CRF层优化注意力层传递来的序列信息时,利用CRF层计算出序列信息中最优的联合概率,得到优化全局的特征序列。
根据本申请实施例的另一方面,还提供了一种命名实体的识别装置,包括:获取单元,用于获取目标文本,其中,所述目标文本为待提取命名实体的文本;识别单元,用于利用所述目标文本的双向语义表征得到所述目标文本中的命名实体。
可选地,所述识别单元还用于:利用BERT语义表征层对所述目标文本进行语义编码,输入到BiLSTM层进行解码,输出到注意力机制层获得注意力权重,通过CRF层优化注意力层传递来的序列信息。
可选地,所述识别单元还用于:在利用BERT语义表征层对所述目标文本进行语义编码时,将所述目标文本通过文本输入层输入至BERT语义表征层;在所述BERT语义表征层利用BERT模型将所述目标文本中的词语进行语义编码,得到所述目标文本中词语的词向量。
可选地,所述识别单元还用于:在输入到BiLSTM层进行解码时,将所述目标文本中词语的词向量输入BiLSTM层来融合上下文特征的信息,得到文本特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司;珠海联云科技有限公司,未经珠海格力电器股份有限公司;珠海联云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011279896.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:印刷品的生成方法和装置、存储介质、电子装置
- 下一篇:一种依西美坦的合成方法