[发明专利]一种意图识别方法、装置、电子设备及存储介质在审
申请号: | 202210307597.9 | 申请日: | 2022-03-25 |
公开(公告)号: | CN114661910A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 董益华 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/242;G06F40/295;G06F40/30 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 郭德霞 |
地址: | 518031 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 意图 识别 方法 装置 电子设备 存储 介质 | ||
本发明实施例公开了一种意图识别方法、装置、电子设备及存储介质,意图识别方法包括:根据原始意图样本数据获取第一目标意图样本数据;其中,第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据;对非长尾输入样本数据进行实体抽象,得到抽象泛化实体词;对抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合,以生成意图匹配泛化字典;根据意图匹配泛化字典构建第一意图识别模型;在确定待识别输入数据为非长尾输入数据的情况下,将待识别输入数据输入至第一意图识别模型中;根据第一意图识别模型输出待识别输入数据的意图识别结果。本发明实施例的技术方案能够提高意图理解的准确率。
技术领域
本发明实施例涉及信息处理等人工智能技术领域,尤其涉及一种意图识别方法、装置、电子设备及存储介质。
背景技术
意图识别也可以称为意图检测(Intent Detection),其用于确定输入的信息用于执行哪一个领域的哪一种操作,其本质属于多元分类问题,广泛应用于搜索及人机交互等智能化交互技术。智能化交互的一种体现在于,智能化产品或应用可以通过意图识别的方式理解需求,并依据需求为提供适当的响应。
意图识别的重要环节就是处理query(查询请求)。每一个query都隐藏着真实的查询意图,在理解query时,需要使用很多不同策略挖掘背后的需求。因此,如何正确识别query意图,分析感兴趣的内容,并在有限的资源位中展示最感兴趣的内容,对提升智能化交互功能的体验具有重要意义。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:目前,现有的意图识别方法在处理query时,基本采用一刀切的原则,并没有对query区分长尾query和非长尾query两种不同类型query的处理方式。长尾query的集中度低,但是累计数量接近无穷。虽然单个长尾query搜索量不多,但是具有长尾效应,总的搜索量与头部的非长尾query量可以相媲美。如果不区分长尾query和非长尾query两种不同类型query的处理方式,采用统一的处理方式理解query,会导致意图理解准确率较低。
发明内容
本发明实施例提供一种意图识别方法、装置、电子设备及存储介质,能够提高意图理解的准确率。
根据本发明的一方面,提供了一种意图识别方法,包括:
根据原始意图样本数据获取第一目标意图样本数据;其中,所述第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据;
对所述非长尾输入样本数据进行实体抽象,得到抽象泛化实体词;
对所述抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合,以生成意图匹配泛化字典;
根据所述意图匹配泛化字典构建第一意图识别模型;
在确定待识别输入数据为非长尾输入数据的情况下,将所述待识别输入数据输入至所述第一意图识别模型中;
根据所述第一意图识别模型输出所述待识别输入数据的意图识别结果。
根据本发明的另一方面,提供了一种意图识别装置,包括:
第一样本数据获取模块,用于根据原始意图样本数据获取第一目标意图样本数据;其中,所述第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据;
抽象泛化实体词获取模块,用于对所述非长尾输入样本数据进行实体抽象,得到抽象泛化实体词;
意图匹配泛化字典生成模块,用于对所述抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合,以生成意图匹配泛化字典;
第一意图识别模型构建模块,用于根据所述意图匹配泛化字典构建第一意图识别模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210307597.9/2.html,转载请声明来源钻瓜专利网。