[发明专利]一种多媒体数据的处理方法及装置在审

专利信息
申请号: 201710725330.0 申请日: 2017-08-22
公开(公告)号: CN107454479A 公开(公告)日: 2017-12-08
发明(设计)人: 刘帅 申请(专利权)人: 无锡天脉聚源传媒科技有限公司
主分类号: H04N21/488 分类号: H04N21/488;H04N21/43;H04N21/431;H04N21/442
代理公司: 北京尚伦律师事务所11477 代理人: 张莉
地址: 214000 江苏省无锡*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多媒体 数据 处理 方法 装置
【说明书】:

技术领域

发明涉及多媒体技术领域,特别涉及一种多媒体数据的处理方法及装置。

背景技术

目前,用户在观看视频等多媒体数据时,常常出现由于视频编码或解码等原因而导致音视频不同步的问题,从而给用户带来很大困扰,严重影响用户体验,因而,这就需要对及早检测音视频是否同步。

发明内容

本发明提供一种多媒体数据的处理方法及装置,用以获取多媒体数据中的视频关键帧,根据视频关键帧确定字幕属性,进而根据字幕属性对多媒体数据中各视频帧进行字幕识别,获得各视频帧的字幕识别结果,从而根据各视频帧的字幕识别结果和各视频帧对应的音频帧,准确判断多媒体数据中音视频是否同步,以及时发现多媒体播放过程中音画不同步的问题以便进行调整。

本发明提供一种多媒体数据的处理方法,包括:

获取所述多媒体数据中的视频关键帧;

根据所述视频关键帧确定字幕属性,其中,所述字幕属性包括所述多媒体数据中字幕的垂直位置和所述字幕中单个字符的宽度;

根据所述字幕属性对所述多媒体数据中各视频帧进行字幕识别,获得所述各视频帧的字幕识别结果,其中,所述各视频帧包括所述视频关键帧;

根据所述各视频帧的字幕识别结果和所述各视频帧对应的音频帧,判断所述多媒体数据中音视频是否同步。

在一个实施例中,根据所述视频关键帧确定字幕属性,包括:

对所述视频关键帧中预设区域进行检测,确定所述视频关键帧的水平边缘图和垂直边缘图;

根据所述水平边缘图和垂直边缘图,确定所述视频关键帧的二值化图像;

根据所述二值化图像确定所述字幕属性。

在一个实施例中,所述根据所述二值化图像确定所述字幕属性,包括:

将所述二值化图像进行水平方向投影,确定像素值峰值的出现位置在所述二值化图像上的垂直坐标;

根据所述像素值峰值的出现位置在所述二值化图像上的垂直坐标,确定所述字幕的垂直位置。

在一个实施例中,所述根据所述二值化图像确定所述字幕属性,包括:

将所述二值化图像进行垂直方向投影,将像素值低于预设像素值的相邻区域确定为字符所在区域;

根据所述字符所在区域的宽度确定所述单个字符的宽度。

在一个实施例中,根据所述字幕属性对所述多媒体数据中各视频帧进行字幕识别,获得所述各视频帧的字幕识别结果,包括:

根据所述单个字符的宽度确定字符滑动窗口的预设宽度;

基于所述字幕的垂直位置,将预设宽度的所述字符滑动窗口在所述各视频帧上逐渐进行滑动,确定所述各视频帧上的各字符;

将所述各字符进行识别,获得所述各视频帧的字幕识别结果。

本发明还提供一种多媒体数据的处理装置,包括:

获取模块,用于获取所述多媒体数据中的视频关键帧;

确定模块,用于根据所述视频关键帧确定字幕属性,其中,所述字幕属性包括所述多媒体数据中字幕的垂直位置和所述字幕中单个字符的宽度;

识别模块,用于根据所述字幕属性对所述多媒体数据中各视频帧进行字幕识别,获得所述各视频帧的字幕识别结果,其中,所述各视频帧包括所述视频关键帧;

判断模块,用于根据所述各视频帧的字幕识别结果和所述各视频帧对应的音频帧,判断所述多媒体数据中音视频是否同步。

在一个实施例中,所述确定模块包括:

第一确定子模块,用于对所述视频关键帧中预设区域进行检测,确定所述视频关键帧的水平边缘图和垂直边缘图;

第二确定子模块,用于根据所述水平边缘图和垂直边缘图,确定所述视频关键帧的二值化图像;

第三确定子模块,用于根据所述二值化图像确定所述字幕属性。

在一个实施例中,所述确定模块包括:

第四确定子模块,用于将所述二值化图像进行水平方向投影,确定像素值峰值的出现位置在所述二值化图像上的垂直坐标;

第五确定子模块,用于根据所述像素值峰值的出现位置在所述二值化图像上的垂直坐标,确定所述字幕的垂直位置。

在一个实施例中,所述第三确定子模块包括:

第一确定单元,用于将所述二值化图像进行垂直方向投影,将像素值低于预设像素值的相邻区域确定为字符所在区域;

第二确定单元,用于根据所述字符所在区域的宽度确定所述单个字符的宽度。

在一个实施例中,所述识别模块包括:

第六确定子模块,用于根据所述单个字符的宽度确定字符滑动窗口的预设宽度;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡天脉聚源传媒科技有限公司,未经无锡天脉聚源传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710725330.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top