[发明专利]音频类别定位方法、装置、电子设备和存储介质有效
| 申请号: | 202111016280.1 | 申请日: | 2021-08-31 |
| 公开(公告)号: | CN113808615B | 公开(公告)日: | 2023-08-11 |
| 发明(设计)人: | 王斌;杨晶生 | 申请(专利权)人: | 北京字跳网络技术有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L15/26;G10L15/04 |
| 代理公司: | 北京植德律师事务所 11780 | 代理人: | 唐华东 |
| 地址: | 100190 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 类别 定位 方法 装置 电子设备 存储 介质 | ||
本公开提供一种音频类别定位方法、装置、电子设备和存储介质,通过将目标音频按照预设时间长度进行切分,得到与目标音频对应的音频片段序列;对于音频片段序列中的每个音频片段,确定该音频片段是否为第一预设类别音频片段;获取对目标音频进行自动语音识别得到的识别语句序列和语句起止时间序列;对于语句起止时间序列中的每个语句起止时间,执行以下确定操作:响应于确定该语句起止时间对应的时间段包括音频片段序列中的第一预设类别音频片段对应的起始时间,将该语句起止时间确定为目标音频中第二预设类别句子音频的起止时间。从而,实现了在目标音频中定位第二预设类别的句子音频起止时间,方便进行指定类别音频内容的定位。
技术领域
本公开的实施例涉及信息处理技术领域,具体涉及音频类别定位方法、装置、电子设备和存储介质。
背景技术
音频事件检测(或称声音事件检测)是指给定一段音频,检测出该段音频是否包含特定的事件,如笑声、键盘声、汽车鸣笛、歌曲、人声等。这种检测一般不涉及具体语音说话内容,只对声音进行分类。
然而仅对音频进行分类不能满足一些具体需求,比如对于被分类为脱口秀音频的音频来说,虽然确定是脱口秀音频,还需要对爆梗点进行定位,以方便用户定位其中的爆梗点进行收听或收看。
发明内容
本公开的实施例提出了音频类别定位方法、装置、电子设备和存储介质。
第一方面,本公开的实施例提供了一种音频类别定位方法,该方法包括:将目标音频按照预设时间长度进行切分,得到与上述目标音频对应的音频片段序列;对于上述音频片段序列中的每个音频片段,确定该音频片段是否为第一预设类别音频片段;获取对上述目标音频进行自动语音识别得到的识别语句序列和语句起止时间序列,其中,上述语句起止时间序列中语句起止时间为上述识别语句序列中相应识别语句对应在上述目标音频的起止时间;对于上述语句起止时间序列中的每个语句起止时间,执行以下确定操作:响应于确定该语句起止时间对应的时间段包括上述音频片段序列中的上述第一预设类别音频片段对应的起始时间,将该语句起止时间确定为上述目标音频中第二预设类别句子音频的起止时间。
在一些可选的实施方式中,上述确定操作还包括:响应于确定该语句起止时间对应的时间段包括上述音频片段序列中的上述第一预设类别音频片段对应的起始时间,将上述识别语句序列中与该语句起止时间对应的识别语句确定为上述第二预设类别的识别语句。
在一些可选的实施方式中,上述第一预设类别音频片段为笑声或掌声音频片段。
在一些可选的实施方式中,上述第二预设类别句子音频为可引起笑声或掌声的句子音频。
在一些可选的实施方式中,上述目标音频为脱口秀音视频对应的音频。
在一些可选的实施方式中,上述方法还包括:将上述第二预设类别句子音频的起始时刻与上述目标音频的播放进度时间轴关联展示。
第二方面,本公开的实施例提供了一种音频类别定位装置,该装置包括:切分单元,被配置成将目标音频按照预设时间长度进行切分,得到与上述目标音频对应的音频片段序列;第一确定单元,被配置成对于上述音频片段序列中的每个音频片段,确定该音频片段是否为第一预设类别音频片段;获取单元,被配置成获取对上述目标音频进行自动语音识别得到的识别语句序列和语句起止时间序列,其中,上述语句起止时间序列中语句起止时间为上述识别语句序列中相应识别语句对应在上述目标音频的起止时间;第二确定单元,被配置成对于上述语句起止时间序列中的每个语句起止时间,执行以下确定操作:响应于确定该语句起止时间对应的时间段包括上述音频片段序列中的上述第一预设类别音频片段对应的起始时间,将该语句起止时间确定为上述目标音频中第二预设类别句子音频的起止时间。
在一些可选的实施方式中,上述确定操作还包括:响应于确定该语句起止时间对应的时间段包括上述音频片段序列中的上述第一预设类别音频片段对应的起始时间,将上述识别语句序列中与该语句起止时间对应的识别语句确定为上述第二预设类别的识别语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字跳网络技术有限公司,未经北京字跳网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111016280.1/2.html,转载请声明来源钻瓜专利网。





