[发明专利]基于对话系统的语音文本处理方法、装置、设备及介质在审
申请号: | 202011271192.1 | 申请日: | 2020-11-13 |
公开(公告)号: | CN112395857A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 吴信朝;周宸;周宝;陈远旭 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F16/33;G06F16/332;G06K9/62;G10L17/22 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 周燕君 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对话 系统 语音 文本 处理 方法 装置 设备 介质 | ||
1.一种基于对话系统的语音文本处理方法,其特征在于,包括:
接收包含目标语音句子的调整指令;所述目标语音句子是指对话系统中的语音识别文本中被对话对象标识出的待调整句子;所述语音识别文本是指对所述对话对象和对话系统中的机器人之间的对话语音进行语音识别之后的文本;
根据预设的词向量字典,对所述目标语音句子进行词向量转换,得到与所述目标语音句子中各目标字词分别对应的目标词向量;
自所述语音识别文本中获取与所述目标语音句子关联的所有上下文句子,根据所述预设的词向量字典,对各所述上下文句子进行词向量转换,得到与所有所述上下文句子对应的上下文表示向量;
根据所述上下文表示向量,确定各所述目标词向量对应的向量权重,并根据所述向量权重调整所述目标语音句子,以得到新的目标语音句子;
根据所述新的目标语音句子更新所述对话系统中的所述语音识别文本之后,提示调整完成。
2.如权利要求1所述的基于对话系统的语音文本处理方法,其特征在于,所述根据预设的词向量字典,对所述目标语音句子进行词向量转换,得到与所述目标语音句子中各目标字词分别对应的目标词向量,包括:
对所述目标语音句子进行分词处理,得到多个所述目标字词;
根据所述预设的词向量字典,确定与各所述目标字词对应的目标词向量。
3.如权利要求1所述的基于对话系统的语音文本处理方法,其特征在于,所述根据所述预设的词向量字典,对各所述上下文句子进行词向量转换,得到与所有所述上下文句子对应的上下文表示向量,包括:
对所述上下文句子进行分词处理,得到所述上下文句子中的多个上下文字词;
根据所述预设的词向量字典,确定与所述上下文句子中的各上下文字词对应的上下文词向量;
对与同一上下文句子对应的所有所述上下文词向量进行第一累加处理,得到与该上下文句子对应的句子向量;
对与各所述上下文句子对应的所有所述句子向量进行第二累加处理,得到所述上下文表示向量。
4.如权利要求1所述的基于对话系统的语音文本处理方法,其特征在于,所述根据所述上下文表示向量,确定各所述目标词向量对应的向量权重,包括:
对所述上下文表示向量与各所述目标词向量进行点积处理,得到与各所述目标词向量对应的点积词向量,并根据各所述点积词向量构建词向量数组;
通过预设分类模型对所述词向量数组进行归一化处理,得到与所述词向量数组对应的向量权重数组;
根据所述向量权重数组,获取与各所述目标词向量对应的向量权重;所述各目标词向量对应的向量权重的和为1。
5.如权利要求1所述的基于对话系统的语音文本处理方法,其特征在于,所述根据预设的词向量字典,对所述目标语音句子进行词向量转换之前,还包括:
获取训练样本集以及包含初始参数的预设语言模型;所述训练样本集中包括至少一个训练样本;所述预设语言模型中包含预设训练词典;
将所述训练样本输入至所述预设语言模型中,根据所述预设训练词典,对各所述训练样本进行词向量预测处理,得到各训练样本中每一字符对应的预测词向量;
对各所述预测词向量进行解码处理,得到与各预测词向量对应的预测字词;
将各预测字词按照与其对应的训练样本中各字符的排列顺序进行结合,得到预测句子;
根据所述预测句子以及所述训练样本,确定所述预设语言模型的预测损失值;
在所述预测损失值未达到预设收敛条件时,迭代更新所述预设语言模型的初始参数,直至所述预测损失值达到所述预设收敛条件时,将收敛之后的所述预设语言模型记录为词向量语言模型。
6.如权利要求1所述的基于对话系统的语音文本处理方法,其特征在于,所述将收敛之后的所述预设语言模型记录为词向量语言模型之后,还包括:
将所述训练样本输入至所述词向量语言模型中,得到与各训练样本中每个字词对应的样本词向量;
将各所述样本词向量存储至所述预设训练词典中,并将存储之后的预设训练词典记录为所述预设词向量字典。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011271192.1/1.html,转载请声明来源钻瓜专利网。