[发明专利]音频切分方法、装置、电子设备、存储介质及产品在审
| 申请号: | 202210042815.0 | 申请日: | 2022-01-14 |
| 公开(公告)号: | CN114464171A | 公开(公告)日: | 2022-05-10 |
| 发明(设计)人: | 李良斌;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G10L15/04 | 分类号: | G10L15/04;G06F16/632;G06F16/638;H04M3/51 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 王静 |
| 地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 切分 方法 装置 电子设备 存储 介质 产品 | ||
本申请公开了一种音频切分方法、装置、电子设备、存储介质及产品,属于音频处理技术领域。该方法从第一对话对象与第二对话对象的音频中切分出第一音频和第二音频,然后将第一音频和第二音频分别切分为多个第一音频片段和多个第二音频片段,通过多个第二音频片段中每相邻两个第二音频片段的时间信息来确定两个对话对象对话过程中第一对话对象对应的音频片段,由于相邻两个第二音频片段之间的时间信息可以表示第一对话对象与第二对话对象进行有效对话的时间信息,因此,根据该时间信息可以从多个第一音频片段中准确确定出第一对话对象对应的多个第三音频片段,这样就可以根据两个对话对象的对话内容准确切分第一音频,从而提高音频切分的准确率。
技术领域
本申请涉及音频处理技术领域,特别涉及一种音频切分方法、装置、电子设备、存储介质及产品。
背景技术
目前,在智能客服外呼过程中或者在智能客服服务过程中,经常会出现智能客服与用户对话的情况。这种情况下,智能客服需要基于用户说话的内容,识别出用户所提出的问题,然后根据该问题检索答案,再根据该答案来回复用户所提出的问题。为了统计智能客服识别问题的准确率,从而确定智能客服解决用户所提出的问题的解决率,需要先从用户与智能客服对话的完整音频中切分出用户对应的音频,再从用户对应的音频中切分出用户与智能客服对话的每一个音频片段,根据切分后的音频片段来统计该准确率,进而确定解决率。
相关技术中,对于用户对应的音频,根据预先设置的静音采样点阈值,确定该音频包括的每个音频帧为静音帧或者非静音帧,然后按照静音帧和非静音帧的顺序,将相邻两个静音段之间的多个非静音帧组成音频片段,最终得到多个音频片段。其中,静音帧用于表示该音频帧处于静音状态,非静音帧用于表示该音频帧处于非静音状态,静音段为由多个静音帧组成的音频片段。
但按照相关技术中的方法对音频的切分是依据静音段的位置来做的,将相邻两个静音段之间的区域切分为一个音频片段,而无法按照用户与智能客服的对话内容准确切分音频,这样就会造成切分的音频片段的对话内容不连续,导致音频切分的准确性差。
发明内容
本申请实施例提供了一种音频切分方法、装置、电子设备、存储介质及产品,可以提高音频切分的准确性。所述技术方案如下:
一方面,提供了一种音频切分方法,所述方法包括:
从第一对话对象与第二对话对象对话的音频中切分出第一音频和第二音频,所述第一音频与所述第一对话对象对应,所述第二音频与所述第二对话对象对应;
基于所述第一音频中每个第一音频帧的语音状态将所述第一音频切分为多个第一音频片段,基于所述第二音频中每个第二音频帧的语音状态将所述第二音频切分为多个第二音频片段,所述语音状态包括静音状态和非静音状态;
基于所述多个第二音频片段中每相邻两个第二音频片段的时间信息,将所述多个第一音频片段合并,得到多个第三音频片段;
基于所述多个第三音频片段的时间信息,重新切分所述第一音频。
在一种可能的实现方式中,所述基于所述第一音频中每个第一音频帧的语音状态将所述第一音频切分为多个第一音频片段,包括:
对于每个第一音频帧,若所述第一音频帧的语音状态与其相邻的第一音频帧的语音状态不同,基于所述第一音频帧的语音状态及其相邻的第一音频帧的语音状态,确定一时间节点,所述时间节点用于表示一个音频片段的开始时间或结束时间;
基于所述第一音频包括的多个第一音频帧得到的多个时间节点,将所述第一音频切分为多个第一音频片段。
在另一种可能的实现方式中,所述基于所述第一音频帧的语音状态及其相邻的第一音频帧的语音状态,确定一时间节点,包括:
获取第一数组,所述第一数组是基于第一音频帧的数量生成的,所述第一数组中的元素值与第一音频帧一一对应,所述第一数组中所述第一音频帧的元素值为默认值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210042815.0/2.html,转载请声明来源钻瓜专利网。





