[发明专利]从音频文件中提取有声片段的方法、装置设备及存储介质有效
申请号: | 201911206708.1 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110910863B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 张天祥;范磊;杨丽涛 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/78 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200126 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频文件 提取 有声 片段 方法 装置 设备 存储 介质 | ||
本发明提供一种从音频文件中提取有声片段的方法、装置、设备及存储介质。其中,该方法包括:获取待处理音频文件;对所述待处理音频文件进行分割,得到多个音频片段;对每个所述音频片段进行语音识别处理,得到语音识别结果;基于所述语音识别结果判断有声片段并提取所述有声片段。本发明解决了处理长音频文件的效率低下等问题,提高了长音频文件中有声片段的定位效率和定位的准确性,以实现快速有效地从长音频文件中提取有声片段,节约时间,提高工作效率。
技术领域
本发明涉及语音识别领域,尤其涉及一种从音频文件中提取有声片段的方法、装置、设备及计算机可读存储介质。
背景技术
随着语音识别技术日趋成熟,语音识别技术已经被广泛应用于各个行业领域,伴随各种领域语音识别软件的出现,用户可以通过语音识别软件,将语音转换为相应的文字,使得用户无需再手动输入文字,给用户的生活和工作带来很大的便利。
在处理长音频文件时,一般为了避免遗漏内容,会选择从头到尾完整听一遍音频文件,这样会花费大量时间,而长音频文件中往往包含大量冗余空白内容,这些空白内容音频不属于有效内容,耗费时间浪费人力,针对处理长音频文件的效率低下等问题,目前尚未提出有效的解决方案。
发明内容
有鉴于此,本发明提供一种从音频文件中提取有声片段的方法、装置、设备及计算机可读存储介质,能够快速有效地在长音频文件中提取有用的音频文件,节约时间,提高工作效率。
为解决上述技术问题,一方面,本发明实施例提供一种从音频文件中提取有声片段的方法,包括:
获取待处理音频文件;对所述待处理音频文件进行分割,得到多个音频片段,可以按照时间大小或音频片段的大小进形切分;对每个所述音频片段进行语音识别处理,得到语音识别结果,识别结果包括每个音频片段的有声片段和无声片段,并在有声片段中得到语音信号或文字信息等,对多个音频片段的识别结果合并,以得到音频片段的完整的语音识别结果,其中可以采用语音端点检测技术(VAD)对每一个音频片段从带有噪声的语音中准确的定位出语音的开始和结束点,以对音频片段去除静音(无声片段)和噪音,以能够精准的对有声片段进行定位,基于所述语音识别结果判断有声片段并提取所述有声片段。
根据本申请的实施例,提高了长音频文件中有声片段的定位效率和定位的准确性,以实现快速有效地从长音频文件中提取有声片段,节约时间,提高工作效率。
在本申请第一方面的一个实施例中,所述语音识别结果包括以字为单位的文本,以及每个字在音频文件中的偏移位置。通过确定每个字在音频片段中的位置可以有效的提取该文本,以提高有声片段提取的速度。
在本申请第一方面的一个实施例中,在得到多个音频片段后攒批进行所述语音识别处理,得到各个批次的所述语音识别结果。也就是说,由于在音频片段中可能有大量的无声音的片段,因此通过积攒大批量音频片段并进行的语音识别处理,可以提高处理结果,并能够快速分析长音频文件的内容。
在本申请第一方面的一个实施例中,对于各个批次的所述语音识别进行排序合并处理,得到排序后的完整的所述语音识别结果,可以完整识别长音频文件的内容并排序。
在本申请第一方面的一个实施例中,基于所述语音识别结果判断有声片段并提取,具体包括:从头开始遍历所述语音识别结果,并基于所述语音识别结果是否存在文本判断当前音频片段是否有声;当所述语音识别结果中存在文本时判断为当前的音频片段有声;根据该文本中的首字的偏移位置,记录有声片段的开始位置;继续遍历所述文本,直至出现一个不存在文本的音频片段,以上一个音频片段中的文本中最后一个字所对应的偏移位置作为该有声片段的结束位置;重复上述步骤,直至针对所述语音识别结果均已判断完毕,得到所述有声片段并提取。由此,可以快速有效地分析长音频文件,找到所有包含有效内容的音频文件片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911206708.1/2.html,转载请声明来源钻瓜专利网。