[发明专利]视频数据处理方法、装置、计算机设备和存储介质有效
申请号: | 201811550722.9 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109714608B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 李成玲 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | H04N21/233 | 分类号: | H04N21/233;H04N21/439;H04N21/4402;H04N21/488;H04N21/43;H04N21/4788;G10L15/22;G10L15/02;G10L15/06;G10L25/45 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 王宁 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及语音识别技术领域,提供了一种视频数据处理方法、装置、计算机设备和存储介质。方法包括:获取待处理视频数据中的音频流数据,对音频流数据进行分帧处理,获取音频流数据的音节特征信息,查找与音节特征信息匹配的目标方言库,根据目标方言库,对音频流数据进行语音识别,生成字幕数据,将字幕数据添加至待处理视频数据,获得处理后的视频数据,避免了在通过视频进行沟通交流的过程中因无法准确理解方言表达的语义的问题,提高了视频沟通效率。 | ||
搜索关键词: | 视频 数据处理 方法 装置 计算机 设备 存储 介质 | ||
【主权项】:
1.一种视频数据处理方法,所述方法包括:获取待处理视频数据中的音频流数据;对所述音频流数据进行分帧处理,获取所述音频流数据的音节特征信息;查找与所述音节特征信息匹配的目标方言库;根据所述目标方言库,对所述音频流数据进行语音识别,生成字幕数据;将所述字幕数据添加至所述待处理视频数据,获得处理后的视频数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811550722.9/,转载请声明来源钻瓜专利网。