[发明专利]字幕显示方法及装置、存储介质、电子设备有效
申请号: | 201910550122.0 | 申请日: | 2019-06-24 |
公开(公告)号: | CN112135197B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 黄思军 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;G10L15/26;H04M1/72454 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 显示 方法 装置 存储 介质 电子设备 | ||
本公开提供一种字幕显示方法及装置、电子设备、存储介质;涉及计算机技术领域。所述字幕显示方法包括:获取当前环境中的环境音量的强度数据,并根据所述强度数据判断是否需要启动字幕显示;在判定需要启动字幕显示时,获取视频数据对应的音频数据;对音频数据进行语音识别处理,生成视频数据对应的字幕数据;在呈现视频数据的显示界面上显示字幕数据。本公开的技术方案能够在媒体音量过小或者周围噪音过大的情况下将视频中的语音内容自动转化为字幕,提升用户的使用体验。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种字幕显示方法、字幕显示装置、电子设备以及计算机可读存储介质。
背景技术
随着互联网技术的发展,人们已经能够随时随地的观看移动设备上的视频。
然而,虽然随时随地能够看视频,给用户带来较好的视频观赏体验,但是在公共场合时也有诸多不便,例如当周围环境比较嘈杂时,如果没有携带耳机或者把视频音量调大时,不仅视频观赏体验较差,而且会影响到身边的人,降低了用户的使用体验。同时,关闭视频的音量会使用户不清楚视频内容,导致用户观赏体验较差。
因此,提供一种根据音量设置以及周围环境噪声变化调整视频数据对应语音内容的呈现方式是非常必要的。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种字幕显示方法、字幕显示装置、电子设备以及计算机可读存储介质,进而在一定程度上克服周围噪声较大或者不方便的情况下,关闭视频音量造成视频观赏体验较差的问题。
根据本公开的第一方面,提供一种字幕显示方法,包括:
获取当前环境中的环境音量的强度数据,并根据所述强度数据判断是否需要启动字幕显示;
在判定需要启动字幕显示时,获取视频数据对应的音频数据;
对所述音频数据进行语音识别处理,生成所述视频数据对应的字幕数据;
在呈现所述视频数据的显示界面上显示所述字幕数据。
在本公开的一种示例性实施例中,对所述音频数据进行语音识别处理,生成所述视频数据对应的字幕数据,还包括:
对所述音频数据进行语音活性检测处理以过滤所述音频数据中的非语音数据;
将过滤后的所述音频数据进行语音识别处理,生成所述视频数据对应的字幕数据。
在本公开的一种示例性实施例中,在判定需要启动字幕显示时,获取视频数据对应的音频数据,包括:
在判定需要启动字幕显示时,通过目标位置处的音频回调接口获取视频数据对应的音频数据。
在本公开的一种示例性实施例中,所述环境音量包括媒体音量和/或噪音音量。
在本公开的一种示例性实施例中,所述获取当前环境中的环境音量的强度数据,并根据所述强度数据判断是否需要启动字幕显示,包括:
获取所述媒体音量的强度数据,并检测所述强度数据是否等于或低于第一预设阈值;或者
获取所述噪音音量的强度数据,并检测所述强度数据是否等于或高于第二预设阈值;或者
获取所述媒体音量的强度数据以及所述噪音音量的强度数据,并检测所述媒体音量的强度数据是否高于第一预设阈值且所述噪音音量的强度数据是否低于第二预设阈值,并计算所述噪音音量的强度数据与所述媒体音量的强度数据的差值数据以判断所述差值数据是否高于第三预设阈值。
在本公开的一种示例性实施例中,所述在判定需要启动字幕显示时,获取视频数据对应的音频数据,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910550122.0/2.html,转载请声明来源钻瓜专利网。