[发明专利]语音处理方法、装置、终端以及程序产品在审
申请号: | 202110629095.3 | 申请日: | 2021-06-04 |
公开(公告)号: | CN115440205A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 林儿;郑欢;陈勇;傅泉辉;王文生;高琴;余侃;鲁惟翔;傅一平;吴逊 | 申请(专利权)人: | 中国移动通信集团浙江有限公司;中国移动通信集团有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02;G10L15/26;G10L15/18;G10L25/63;G10L13/047 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 李宇翔 |
地址: | 310000 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 终端 以及 程序 产品 | ||
本发明公开了一种语音处理方法、装置、终端以及程序产品,属于语音分析技术领域。本发明语音处理方法包括以下步骤:在检测到用户开始输入语音时,获取用户输入的当前语音数据;对语音数据进行预处理,获得多个声音特征参数向量;对所有声音特征参数向量聚类处理,获得当前语音数据所属的情绪类别;根据情绪类别,从预设应答库中筛选出当前语音数据对应的应答信息。本发明可以准确的对营销人员的语气进行识别从而做出符合该语气的应答,使得该应答场景较为贴合业务人员谈单时候的交谈环境,进而提高业务人员的服务质量。
技术领域
本发明涉及语音分析技术领域,尤其涉及一种语音处理方法、装置、终端以及程序产品。
背景技术
相关技术中,营销人员的话术培训可通过语音交互类业务话术培训程序产品实现,通过语音识别培训人员输入的话语,然后智能语音播放相应的应答文本。
但是,该类语音交互类业务话术培训程序产品仅仅具有简单的应答功能,话术培训与实际发生的营销人员和客户的实际谈单情况相差较远。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种语音处理方法、装置、终端以及程序产品,旨在解决现有语音交互与实际情况不符的技术问题。
为实现上述目的,第一方面,本发明提供一种语音处理方法,所述语音处理方法包括以下步骤:
在检测到用户开始输入语音时,获取用户输入的当前语音数据;
对语音数据进行预处理,获得多个声音特征参数向量;
对所有声音特征参数向量聚类处理,获得当前语音数据所属的情绪类别;
根据情绪类别,从预设应答库中筛选出当前语音数据对应的应答信息。
在一实施例中,对所有声音特征参数向量聚类处理,获得当前语音数据所属的情绪类别的步骤包括:
对所有声音特征参数向量进行分组处理,以得到多个声音特征参数向量原始组;
通过期望最大化算法对所有声音特征参数向量原始组进行聚类处理,获得预设数量个情绪聚类组;
通过高斯混合模型对所有情绪聚类组进行处理,获得每个情绪聚类组对应的概率分布值;
将所有概率分布值中的最大值的情绪类别确定为当前语音数据所属的情绪类别。
在一实施例中,通过高斯混合模型对所有情绪聚类组,获得每个情绪聚类组对应的概率分布值的步骤,包括:
通过第一预设公式计算得到每种情绪聚类组中特征参数向量的高斯分布概率密度;
第一预设公式为:
其中,bi(x)为当前语音数据中第i组情绪聚类组中特征参数向量的高斯分布概率密度,μi为第i组情绪聚类组中所有特征参数向量的均值向量;∑i为第i组情绪聚类组中所有特征参数向量的协方差矩阵;|∑i|为∑i的行列式的值,为∑i的逆矩阵;
基于所有情绪类别的高斯分布概率密度和第二预设公式,获得每个情绪聚类组对应的概率分布值;
第二预设公式为:
其中,M为预设数量;x为当前语音数据中的特征参数向量;pi为第i组情绪聚类组的权重;λ为一个高斯模型,p为每个情绪聚类组对应的概率分布值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团浙江有限公司;中国移动通信集团有限公司,未经中国移动通信集团浙江有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110629095.3/2.html,转载请声明来源钻瓜专利网。