[发明专利]一种视频编解码的方法及装置在审
申请号: | 202110080819.3 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112887730A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 包佳晶 | 申请(专利权)人: | 百果园技术(新加坡)有限公司 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N21/2343;H04N21/4402 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 新加坡巴西班让路*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 解码 方法 装置 | ||
1.一种视频编码方法,其特征在于,所述方法包括:
在对目标视频进行编码时,对当前待编码的视频帧进行文字检测;
若针对所述视频帧的文字检测的结果为存在文字信息,则提取出该视频帧中的文字信息,并将所述文字信息编码成文字编码数据;
对提取出所述文字信息的视频帧进行去文字处理,生成待编码视频帧,并对所述待编码视频帧进行视频编码,生成视频编码数据;
将所述文字编码数据添加到所述视频编码数据中;
将所述视频编码数据加入到视频码流中进行输出。
2.根据权利要求1所述的方法,其特征在于,所述对当前待编码的视频帧进行文字检测,包括:
将当前待编码的视频帧输入至已训练的光学字符识别模型,以通过所述光学字符识别模型识别出所述视频帧中是否包含文字信息。
3.根据权利要求1或2所述的方法,其特征在于,所述文字信息包括但不限于:文字内容、文字样式信息、文字位置信息。
4.根据权利要求3所述的方法,其特征在于,所述对提取出所述文字信息的视频帧进行去文字处理,生成待编码视频帧,包括:
根据所述文字样式信息以及所述文字位置信息,确定所述文字内容所处的区域;
将所述文字内容所处的区域中的像素的像素值替换为指定像素值,所述指定像素值包括与该区域相邻的像素的像素值。
5.根据权利要求1所述的方法,其特征在于,所述将所述文字信息编码成文字编码数据,包括:
对所述文字信息进行Unicode编码,生成文字编码数据。
6.根据权利要求1或2或5所述的方法,其特征在于,所述将所述文字编码数据添加到所述视频编码数据中,包括:
将当前视频帧的文字编码数据作为补充增强信息添加到该视频帧的视频编码数据中。
7.一种视频解码方法,其特征在于,所述方法包括:
在对视频码流进行解码时,判断当前待解码的视频编码数据是否携带文字编码数据;
若当前待解码的视频编码数据携带文字编码数据,则对所述文字编码数据进行解码,获得文字信息;
对所述视频编码数据进行解码,获得对应的视频帧;
在所述视频帧中的对应位置添加所述文字信息。
8.根据权利要求7所述的方法,其特征在于,所述文字信息包括:文字内容、文字样式信息、文字位置信息;
所述在所述视频帧中的对应位置添加所述文字信息,包括:
在所述视频帧中定位所述文字位置信息对应的位置,并在所述位置中以所述文字样式信息贴上所述文字内容。
9.一种视频编码装置,其特征在于,所述装置包括:
文字检测模块,用于在对目标视频进行编码时,对当前待编码的视频帧进行文字检测;
文字编码模块,用于若针对所述视频帧的文字检测的结果为存在文字信息,则提取出该视频帧中的文字信息,并将所述文字信息编码成文字编码数据;
去文字处理模块,用于对提取出所述文字信息的视频帧进行去文字处理,生成待编码视频帧;
视频编码模块,用于对所述待编码视频帧进行视频编码,生成视频编码数据;
码流输出模块,用于将所述文字编码数据添加到所述视频编码数据中,并将所述视频编码数据加入到视频码流中进行输出。
10.一种视频解码装置,其特征在于,所述装置包括:
判断模块,用于在对视频码流进行解码时,判断当前待解码的视频编码数据是否携带文字编码数据;
文字解码模块,用于若当前待解码的视频编码数据携带文字编码数据,则对所述文字编码数据进行解码,获得文字信息;
视频解码模块,用于对所述视频编码数据进行解码,获得对应的视频帧;
文字恢复模块,用于在所述视频帧中的对应位置添加所述文字信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百果园技术(新加坡)有限公司,未经百果园技术(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110080819.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种立式厌氧发酵罐
- 下一篇:一种停车设备台车用平层举升装置