[发明专利]基于语音识别的人机问答方法、装置、设备和存储介质在审
申请号: | 201910047233.X | 申请日: | 2019-01-17 |
公开(公告)号: | CN109920415A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 王昊;胡家义;吴建林;曾文韬;曹阳;钱锟;庄怡;王婉君;韦柏松;李山亭;田磊 | 申请(专利权)人: | 平安城市建设科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L15/10 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 聊天 编辑距离 标准信息 文本信息 语音聊天 存储介质 目标词语 预设 归一化处理 回复信息 聊天信息 信息对应 信息输入 用户语音 预设距离 数据库 输出 | ||
1.一种基于语音识别的人机问答方法,其特征在于,所述基于语音识别的人机问答方法包括以下步骤:
在接收到用户输入的语音聊天信息时,将所述语音聊天信息输入至预设语音识别模型,得到所述语音聊天信息对应的文本信息;
获取所述文本信息中的目标词语,并将所述目标词语进行归一化处理,得到所述文本信息对应的标准信息;
计算所述标准信息与预设聊天数据库中各聊天模板的编辑距离;
在存在小于预设距离阈值的编辑距离时,将与所述标准信息编辑距离最小的聊天模板作为目标聊天模板,并输出所述目标聊天模板对应的回复信息。
2.如权利要求1所述的基于语音识别的人机问答方法,其特征在于,所述计算所述标准信息与预设聊天数据库中各聊天模板的编辑距离的步骤,包括:
获取所述标准信息对应的标准字符串str1和所述标准字符串str1的长度m;
查询预设聊天数据库,获取所述预设聊天数据库中各聊天模板,获取所述聊天模板对应的问题字符串str2和所述问题字符串str2的长度n;
创建一个维度为(m+1)*(n+1)的矩阵d,并扫描所述标准字符串str1和所述问题字符串str2,在str1[i]=str2[j]时,则temp计为0,反之,temp计为1;
将d[i-1,j]+1、d[i,j-1]+1和d[i-1,j-1]+temp中的最小值赋值给矩阵d[i,j],在扫描完成后,返回所述矩阵d的最后一个值d[n][m]作为所述标准信息与所述聊天模板的编辑距离。
3.如权利要求1所述的基于语音识别的人机问答方法,其特征在于,所述计算所述标准信息与预设聊天数据库中各聊天模板的编辑距离的步骤之后,包括:
在不存在小于预设距离阈值的编辑距离时,将所述文本信息输入至预设神经网络模型,通过所述预设神经网络模型处理所述文本信息,得到所述文本信息对应的聊天意图;
查询预设答复词语集合,生成与所述聊天意图匹配的回复信息,并输出所述回复信息。
4.如权利要求1所述的基于语音识别的人机问答方法,其特征在于,所述在接收到用户输入的语音聊天信息时,将所述语音聊天信息输入至预设语音识别模型,得到所述语音聊天信息对应的文本信息的步骤之前,包括:
分别采集预设方言语系和普通话语系朗读语音信息,并提取各所述语音信息对应的语音特征参数,将各所述语音特征参数组成语音特征集合;
抽取所述语音特征集合中预设比例的各所述语音特征参数,并通过各所述语音特征参数构建初始语音识别模型;
通过迭代算法训练所述初始语音识别模型,得到最优模型参数,并将训练得到所述最优模型参数对应的语音识别模型作为预设语音识别模型。
5.如权利要求1所述的基于语音识别的人机问答方法,其特征在于,所述获取所述文本信息中的目标词语,并将所述目标词语进行归一化处理,得到所述文本信息对应的标准信息的步骤,包括:
将所述文本信息输入预设词语识别模型,通过所述预设词语识别模型对所述文本信息进行分词处理,得到所述文本信息对应的分词集合;
将所述分词集合中的关键词与预设词语集合中的预设目标词进行比对,获取与所述预设目标词匹配的目标关键词;
将所述目标关键词作为所述文本信息中的目标词语,将所述目标词语替换为所述预设目标词对应的模板词,得到所述文本信息对应的标准信息。
6.如权利要求1所述的基于语音识别的人机问答方法,其特征在于,所述获取所述文本信息中的目标词语,并将所述目标词语进行归一化处理,得到所述文本信息对应的标准信息的步骤之后,包括:
将所述标准信息与预设标准数据库中的正例模板和负例模板进行匹配,得到正例得分和负例得分,其中,正例得分是指标准信息与正例模板的相似度,负例得分是指标准信息与负例模板的相似度;
在所述正例得分大于所述负例得分时,执行步骤:计算所述标准信息与预设聊天数据库中各聊天模板的编辑距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安城市建设科技(深圳)有限公司,未经平安城市建设科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910047233.X/1.html,转载请声明来源钻瓜专利网。