[发明专利]一种实体识别方法、装置及计算设备在审

专利信息
申请号: 202111412260.6 申请日: 2021-11-25
公开(公告)号: CN114139542A 公开(公告)日: 2022-03-04
发明(设计)人: 徐丞申;刘荣;黄萧;喻杰;李晓华;张金伟 申请(专利权)人: 北京皮尔布莱尼软件有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F16/35;G06K9/62
代理公司: 北京思睿峰知识产权代理有限公司 11396 代理人: 赵爱军;高攀
地址: 100080 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实体 识别 方法 装置 计算 设备
【说明书】:

发明公开了一种实体识别方法、装置及计算设备,方法包括:将目标文本输入到预设的实体识别模型进行处理,得到目标文本所包括的预定实体类型下的实体词;将所述实体词输入到预设的分类模型进行处理,得到所述实体词所属的第一类别;从多个实体名称集中获取所述第一类别所对应的目标实体名称集;将所述实体词与目标实体名称集中的实体名称进行匹配处理,得到与所述实体词相匹配的目标实体名称,作为所述目标文本的实体识别结果。

技术领域

本发明涉及自然语言处理领域,具体涉及一种在人机对话中的实体识别方法、装置及计算设备。

背景技术

近年来,随着人工智能技术的飞速发展,智能外呼电话机器人已经越来越多地应用在企业电话营销领域,例如对用户的购车意向线索清洗、理财产品营销等。其中,意图识别是电话机器人系统中最为核心的模块,旨在对电话机器人场景中用户的回答进行自动识别,精确理解用户的意图,为电话机器人后续的流程跳转提供指导。在意图识别中,需要对用户语句所包括的实体进行实体识别,实体识别的效果影响到意图识别准确与否,进而影响整个电话机器人系统的用户体验,因此有着重要的研究价值。

随着深度学习的发展与应用,以及深度学习与传统统计学习模型的结合,实体识别的精度可谓越来越高。常用的算法有idcnn+crf/bilstm+crf/bert+crf/albert+crf等算法模型。但是单一地使用实体识别模型我们仅仅是能检测到实体,并不能将实体还原回标准名称。例如地点实体“青海”、“青海省”可能需要统一还原成标准名称“青海省”。

一种解决方案为,对非标准名称用字典进行穷举,映射成标准名称。也就是说,维护一个标准名称与非标准名称的对应关系字典,在字典中,一个标准名称可能对应多个非标准名称。例如,在地点实体识别中将“青海”、“青海省”统一映射成“青海省”。但是,一旦实体数量过多或具体实体的非标准名称过多时穷举一方面会非耗时,另一方面根本无法实现真正地穷举。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的实体识别方法、装置及计算设备。

根据本发明的一个方面,提供一种文本意图识别方法,在计算设备中执行,所述计算设备中存储有多个实体名称集,每个实体名称集分别对应一种类别标签,并包括该类别标签下的多个实体名称,所述方法包括:

将目标文本输入到预设的实体识别模型进行处理,得到目标文本所包括的预定实体类型下的实体词;

将所述实体词输入到预设的分类模型进行处理,得到所述实体词所属的第一类别;

从所述多个实体名称集中获取所述第一类别所对应的目标实体名称集;

将所述实体词与目标实体名称集中的实体名称进行匹配处理,得到与所述实体词相匹配的目标实体名称,作为所述目标文本的实体识别结果。

可选地,在根据本发明的实体识别方法中,所述实体识别模型为idcnn+crf模型。

可选地,在根据本发明的实体识别方法中,所述分类模型为text cnn模型、textrnn模型或者text crnn模型。

可选地,在根据本发明的实体识别方法中,采用预设的文本匹配模型进行所述匹配处理。

可选地,在根据本发明的实体识别方法中,所述匹配处理的步骤包括从目标实体名称集中取出一个实体名称;将取出的实体名称与所述实体词组成文本对,输入到所述文本匹配模型进行处理,得到实体名称与所述实体词的文本相似度;从目标实体集中取出下一个实体名称后重复上述步骤,直到目标实体名称集中的所有实体名称匹配完成;获取文本相似度最高的实体名称,作为目标实体名称。

可选地,在根据本发明的实体识别方法中,所述文本匹配模型为dsmm模型、convnet模型或者drcn模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京皮尔布莱尼软件有限公司,未经北京皮尔布莱尼软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111412260.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top