[发明专利]命名实体识别方法、装置、计算机设备和存储介质在审
| 申请号: | 202110191377.X | 申请日: | 2021-02-20 |
| 公开(公告)号: | CN112926326A | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 崔健 | 申请(专利权)人: | 深圳追一科技有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 纪婷婧 |
| 地址: | 518057 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 命名 实体 识别 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种命名实体识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别的语句,并确定语句对应的业务流程;查询与业务流程对应预设的至少一个召回模板;将语句与至少一个召回模板进行匹配,根据匹配结果确定在语句中与至少一个召回模板匹配成功的待干预语句;通过与业务流程对应预设的干预模板,对待干预语句进行实体识别干预,根据实体识别干预结果获得语句的命名实体识别结果。采用本方法能够提高命名实体识别的准确性。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种命名实体识别方法、装置、计算机设备和存储介质。
背景技术
随着人工智能(Artificial Intelligence,AI)技术的发展,自然语言处理(Natural Language Processing,NLP)技术在语音识别、语音翻译、理解完整的句子、理解匹配词的同义词,以及生成语法正确完整句子和段落等方面得到广泛的应用。作为自然语言处理的一个基础任务,命名实体识别(Named Entities Recognition,NER)的目的在于识别语料中人名、地名、组织机构名等有具体含义的实体,如从语句中识别出人名、地名、机构名、时间、日期等命名实体。
目前,在针对有歧义的语句进行识别时,如对于“南京都”进行命名实体识别,传统的命名实体识别方法可能识别到“南京”或“京都”,命名实体识别的准确性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高命名实体识别准确性的命名实体识别方法、装置、计算机设备和存储介质。
一种命名实体识别方法,所述方法包括:
获取待识别的语句,并确定语句对应的业务流程;
查询与业务流程对应预设的至少一个召回模板;
将语句与至少一个召回模板进行匹配,根据匹配结果确定在语句中与至少一个召回模板匹配成功的待干预语句;
通过与业务流程对应预设的干预模板,对待干预语句进行实体识别干预,根据实体识别干预结果获得语句的命名实体识别结果。
在其中一个实施例中,将语句与至少一个召回模板进行匹配,根据匹配结果确定在语句中与至少一个召回模板匹配成功的待干预语句,包括:确定至少一个召回模板中的召回特征字段;将召回特征字段在语句中进行字符匹配,当得到的字符匹配结果为匹配成功时,确定匹配成功的目标召回模板;基于目标召回模板从语句中确定待干预语句。
在其中一个实施例中,基于目标召回模板从语句中确定待干预语句,包括:确定目标召回模板中的待干预槽位;根据召回特征字段和待干预槽位将语句进行语句划分,得到语句划分结果;将语句划分结果中与待干预槽位对应的字段确定为待干预语句。
在其中一个实施例中,通过与业务流程对应预设的干预模板,对待干预语句进行实体识别干预,根据实体识别干预结果获得语句的命名实体识别结果,包括:查询与业务流程对应预设的正向干预模板;将正向干预模板与待干预语句的各字段进行正向匹配,得到正向匹配结果;当正向匹配结果为匹配成功时,将待干预语句中与正向干预模板匹配成功的字段,确定为语句的命名实体识别结果。
在其中一个实施例中,通过与业务流程对应预设的干预模板,对待干预语句进行实体识别干预,根据实体识别干预结果获得语句的命名实体识别结果,包括:查询与业务流程对应预设的负向干预模板;将负向干预模板与待干预语句的各字段进行负向匹配,得到负向匹配结果;当负向匹配结果为匹配成功时,确定语句的命名实体识别结果中不包括待干预语句中与负向干预模板匹配成功的字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110191377.X/2.html,转载请声明来源钻瓜专利网。





