[发明专利]意图识别方法、装置及计算机可读存储介质在审
申请号: | 202210713708.6 | 申请日: | 2022-06-22 |
公开(公告)号: | CN115204168A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 王章定;朱亚杰;王波;马伯睿 | 申请(专利权)人: | 合众新能源汽车有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/36;G06F16/33 |
代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 刘科 |
地址: | 314500 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 装置 计算机 可读 存储 介质 | ||
本申请公开了一种意图识别方法、装置及计算机可读存储介质,包括:对待识别语句进行分词,获得对应的分词结果;根据分词结果查询预设知识图谱,获取分词结果中的至少部分分词对应的第一实体、与第一实体直接相连的至少一第二实体以及第一实体与第二实体之间的关系;基于预设知识图谱中的各实体以及各实体之间关系的编号,获取至少部分分词分别对应的实体向量和关系向量;将各分词分别对应的实体向量和关系向量拼接后进行全连接层的转换,得到对待识别语句的基于词的表示向量;根据基于词的表示向量,通过预先训练的意图识别模型进行意图识别,获得对待识别语句的识别结果。如此,提升了意图识别的准确性和稳定性。
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种意图识别方法、装置及计算机可读存储介质。
背景技术
在对话领域,意图识别任务是一个应用广泛且比较成熟的任务,当前可用的意图识别模型有很多,比如LSTM、GRU、TextCNN、Bert等。而这些模型主要是针对一个相对稳定的数据集,且其主要针对的数据是文本数据。然而,对于小样本问题和新词发现问题,现有的意图识别方法的准确性和稳定性有待提升。
发明内容
本发明的目的在于提供一种意图识别方法、装置及计算机可读存储介质,通过引入知识图谱对待识别语句进行表示,进而基于获得的基于词的表示向量进行意图识别,提升了意图识别的准确性和稳定性。
为达到上述目的,本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种意图识别方法,包括:
对待识别语句进行分词,获得对应的分词结果;
根据所述分词结果查询预设知识图谱,获取所述分词结果中的至少部分分词对应的第一实体、与所述第一实体直接相连的至少一第二实体以及所述第一实体与所述第二实体之间的关系;
基于所述预设知识图谱中的各实体以及各实体之间关系的编号,获取所述至少部分分词分别对应的实体向量和关系向量;
将各所述分词分别对应的所述实体向量和所述关系向量拼接后进行全连接层的转换,得到对所述待识别语句的基于词的表示向量;
根据所述基于词的表示向量,通过预先训练的意图识别模型进行意图识别,获得对所述待识别语句的识别结果。
在一实施方式中,所述将各所述分词分别对应的所述实体向量和所述关系向量拼接后进行全连接层的转换,得到对所述待识别语句的基于词的表示向量,包括以下步骤:
将各所述分词分别对应的实体向量和关系向量进行堆叠,获得各所述分词对应的矩阵;
将各所述分词对应的矩阵进行拼接后,对拼接后获得的目标矩阵进行全连接层的转换,得到对所述待识别语句的基于词的表示向量。
在一实施方式中,所述根据所述基于词的表示向量,通过预先训练的意图识别模型进行意图识别,获得对所述待识别语句的识别结果,包括以下步骤:
获取对所述待识别语句的基于字的表示向量;
将所述基于词的表示向量和所述基于字的表示向量进行堆叠,获得所述待识别语句的表示向量;
将所述待识别语句的表示向量输入预先训练的意图识别模型,获得对所述待识别语句的识别结果。
在一实施方式中,所述将所述所述基于词的表示向量和所述基于字的表示向量进行堆叠,获得所述待识别语句的表示向量之前,还包括以下步骤:
设置所述基于词的表示向量与所述基于字的表示向量的维度一致。
第二方面,本发明实施例提供了一种意图识别装置,所述装置包括:
分词模块,用于对待识别语句进行分词,获得对应的分词结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合众新能源汽车有限公司,未经合众新能源汽车有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210713708.6/2.html,转载请声明来源钻瓜专利网。