[发明专利]一种语义识别方法、装置以及相关设备在审
| 申请号: | 201910431681.X | 申请日: | 2019-05-20 |
| 公开(公告)号: | CN110232914A | 公开(公告)日: | 2019-09-13 |
| 发明(设计)人: | 陈诗锦 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
| 主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/18;G10L15/26;G06F17/27 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语义识别 对话语句 文本信息 词向量 词语 方法和装置 词语转换 存储介质 记忆单元 神经网络 转换 对话 | ||
本公开实施例公开了一种语义识别方法和装置以及存储介质,该方法包括:获取对话语句,将所述对话语句转换成文本信息后利用词典将所述文本信息分成N个词语,并将所述N个词语转换成对应的N个词向量;其中,所述词典中包含催收对话中出现的词语;利用加入了双向长短时记忆单元的神经网络对所述N个词向量进行语义识别,并给出语义识别结果。采用本公开实施例,能够提高语义识别的精度。
技术领域
本公开涉及人工智能和语义识别领域,尤其涉及一种语义识别方法和装置、相关设备以及存储介质。
背景技术
随着人工智能的迅猛发展,语义识别已经逐渐用到了各行各业中,如智能导航系统、智能客服系统、以及机器人领域等等。但是在智能客服系统中,尤其是在智能催收客服系统中,在语义识别过程中,不能有效地识别出词语的同义词,语义识别率有待提高。
发明内容
本公开实施例提供一种语义识别技术。
第一方面,公开了一种语义识别方法,包括:
获取对话语句,将所述对话语句转换成文本信息后利用词典将所述文本信息分成N个词语,并将所述N个词语转换成对应的N个词向量;其中,所述词典中包含催收对话中出现的词语;
利用加入了双向长短时记忆单元的神经网络对所述N个词向量进行语义识别,并给出语义识别结果。
在一种可能的实现方式中,所述对话语句转换成文本信息后利用词典将所述文本信息分成N个词语之前,包括:
获取人工客服在催收场景中的对话,基于所述催收场景中的对话构建词典。
在一种可能的实现方式中,所述利用词典将所述文本信息分成N个词语,包括:
将所述文本信息与所述词典中的词语进行相似度计算,根据相似度计算结果将所述文本信息分成N个词语。
在一种可能的实现方式中,所述将所述文本信息与所述词典中的词语进行相似度计算,根据相似度计算结果将所述文本信息分成N个词语,包括:
将所述文本信息与所述词典中的词语进行相似度计算,得到N个大于相似度阈值的相似度值;
根据N个大于相似度阈值的相似度值对应的词语,将所述文本信息分成N个词语。
在一种可能的实现方式中,所述将所述文本信息与所述词典中的词语进行相似度计算,根据相似度计算结果将所述文本信息分成N个词语,包括:
将所述文本信息与所述词典中的词语进行相似度计算得到M个词语,所述M个词语的相似度值大于相似度阈值;
若所述M个词语中包含目标字分别与其前后相邻的字组成的词语,从所述目标字分别与其前后相邻的字组成的词语中选择相似度值大的词语;
根据所述M个词语以及所述选择出的词语,将所述文本信息分成N个词语,其中N<M。
在一种可能的实现方式中,所述利用加入了双向长短时记忆单元的神经网络对所述N个词向量进行语义识别,并给出语义识别结果,包括:
构建加入了双向长短时记忆单元的神经网络,所述双向长短时记忆单元中加入了注意力机制;
训练所述神经网络,所述神经网络的训练集中包含催收场景中的对话语句;
利用训练后的所述神经网络对所述N个词向量进行语义识别,并给出语义识别结果。
在一种可能的实现方式中,所述利用加入了双向长短时记忆单元的神经网络对所述N个词向量进行语义识别,并给出语义识别结果之后,包括:
建立对话管理模型,所述对话管理模型中将每一种类型的对话设置标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910431681.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音识别仲裁逻辑
- 下一篇:声音内容控制装置、声音内容控制方法以及存储介质





