[发明专利]回声检测的方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202211410963.X | 申请日: | 2022-11-11 |
公开(公告)号: | CN115762481A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 薛雯飞;曾文佳;韩亚昕 | 申请(专利权)人: | 零犀(北京)科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L21/0216;G10L25/51 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 吕爱霞 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 回声 检测 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请属于语音处理技术领域,公开了回声检测的方法、装置、电子设备及计算机可读存储介质,该方法包括,获取向目标设备发送的第一语音;获取目标设备基于第一语音回复的第二语音;确定第一语音与第二语音之间的相似度;根据相似度,获得回声检测结果。这样,可以对语音回声进行准确检测,以避免回声导致的语音交互错误问题。
技术领域
本申请涉及语音处理技术领域,具体而言,涉及回声检测的方法、装置、电子设备及计算机可读存储介质。
背景技术
在一些语音通话场景(如,用户在空旷的地方使用免提进行通话的场景)中,可能存在通话回声的问题。
例如,用户A和用户B分别通过第一终端和第二终端进行通话。由于用户B处于空旷的地方免提通话,存在回声,因此,第二终端将用户A发来的语音的回声,传送至用户A的第一终端,使得用户A将回声识别为用户B的语音回复,导致用户之间的通话错误问题。
因此,需要一种回声检测的技术方案,检测语音会话中是否存在回声,以便进行回声处理。
发明内容
本申请实施例的目的在于提供回声检测的方法、装置、电子设备及计算机可读存储介质,用以在进行语音会话时,对语音回声进行准确检测,以避免回声导致的语音交互错误问题。
一方面,提供一种回声检测的方法,包括:
获取向目标设备发送的第一语音;
获取目标设备基于第一语音回复的第二语音;
确定第一语音与第二语音之间的相似度;
根据相似度,获得回声检测结果。
一种实施方式中,确定第一语音与第二语音之间的相似度,包括:
提取第一语音的第一音频特征,以及第二语音的第二音频特征;
确定第一音频特征以及第二音频特征之间的音频特征匹配度;
将音频特征匹配度,确定为相似度。
一种实施方式中,确定第一语音与第二语音之间的相似度,包括:
对第一语音进行文本转换,获得第一语音文本;
对第二语音进行文本转换,获得第二语音文本;
确定第一语音文本和第二语音文本之间的文本特征匹配度;
将文本特征匹配度,确定为相似度。
一种实施方式中,确定第一语音与第二语音之间的相似度,包括:
确定第一语音和第二语音的音频特征匹配度;
确定第一语音和第二语音的文本特征匹配度;
根据音频特征匹配度以及文本特征匹配度,确定相似度。
一种实施方式中,根据音频特征匹配度以及文本特征匹配度,确定相似度,包括:
将音频特征匹配度以及文本特征匹配度进行加权求和,获得相似度;
或者,将音频特征匹配度以及文本特征匹配度的组合,确定为相似度。
一种实施方式中,根据相似度,获得回声检测结果,包括:
若确定相似度符合语音异常条件,则确定存在回声;
或者,若确定相似度符合语音异常条件,则确定存在回声异常,并累计回声异常次数,若确定回声异常次数高于次数阈值,则确定存在回声。
一种实施方式中,方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于零犀(北京)科技有限公司,未经零犀(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211410963.X/2.html,转载请声明来源钻瓜专利网。