[发明专利]一种文字清晰的视频压缩传输方法及系统有效
申请号: | 201910730436.9 | 申请日: | 2019-08-08 |
公开(公告)号: | CN110351564B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 张吾进;洪雪荣;张燕威 | 申请(专利权)人: | 上海纽菲斯信息科技有限公司 |
主分类号: | H04N19/46 | 分类号: | H04N19/46;H04N21/431;G06K9/00;G06K9/32 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国栋 |
地址: | 200233 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 清晰 视频压缩 传输 方法 系统 | ||
1.一种文字清晰的视频压缩传输方法,其特征在于:包括如下步骤,
S1、采用文字区域检测算法对输入的原始图像进行检测,得到大小合适的文本区域图像集合;
S2、根据得到的文本区域大小和位置信息,从原始图像中去除文本块图像,得到待编码图像;
S3、对待编码图像进行H264编码,得到主码流;采用文字块压缩编码算法对文本区域图像集合进行压缩编码,得到文字码流;
S4、将主码流和文字码流一起打包发送到客户端;
S5、客户端对接收到的主码流和文字码流进行解码,分别得到待编码图像和文本区域图像集合;
S6、将文本区域图像集合在待编码图像上进行图像叠加,得到解码还原后的最终图像;
所述文本区域图像集合包含文本图像集合和位置大小信息集合;
所述文字区域检测算法包括如下内容:
A1、采用最大稳定极值区域算法对输入的原始图像进行检测,得到文本矩形区域;
A2、采用非极大值抑制算法对文本矩形区域进行去重复区域得到去重叠文本矩形区域;
A3、采用最小外接矩形法对本身区域小、间隔小的去重叠文本矩形区域进行拼接,得到大小合适的文本区域图像集合;
所述文字块压缩编码算法具体包括如下内容,
B1、从文本区域图像集合中的文本区域图像集合序列中,分离出文本图像集合序列以及位置大小信息集合序列,并从文本图像集合序列以及位置大小信息集合序列中,查找前后帧位置大小不相同的第一文字区域和前后帧位置大小相同的第二文字区域;
B2、对第一文字区域进行JPEG编码,得到第一码流;
B3、对第二文字区域,取一定间隔的一帧作为关键帧,将关键帧采用JPEP编码,得到第二码流;对于非关键帧,取其前后帧文字区域图像差值,并对差值进行熵编码压缩得到第三码流;
B4、将第一码流、第二码流、第三码流以及位置大小信息序列进行打包,得到文字码流。
2.一种文字清晰的视频压缩传输系统,其特征在于:所述传输系统用于实现上述权利要求1所述的传输方法,所述传输系统包括,
文字检测模块;用于对输入的原始图像采用最大稳定极值区域算法检测出文本矩形区域,再结合非极大值抑制算法得到不重叠的文本矩形区域;若原始图形中包含的文字信息较多,则产生独立的去重叠文本矩形区域较多,则对去重叠文本矩形区域进行合并拼接,根据设定的阈值采用最小外接矩形法对较小的去重叠文本区域进行合并,得到大小合适的文本区域图像集合,便于下一步编码处理;
编码模块;用于对原始图像中提取的文本区域图像集合和待编码图像进行单独的编码,分别获取主码流和文字码流;
数据打包模块;用于对主码流和文字码流分别进行打包发送至客户端,其中主码流采用标准H264码流格式,增设帧号标识;文字码流则包含每个文字区域的位置、大小、数据包长度、图像数据以及对应待编码图像的帧号标识;
客户端;用于接收数据打包模块发送过来的主码流和文字码流,并对其进行解码,之后将文本区域图像集合在待编码图像上进行图像叠加,得到解码还原后的最终图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海纽菲斯信息科技有限公司,未经上海纽菲斯信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910730436.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于编解码视频数据的方法及装置
- 下一篇:一种参考区域运动矢量导出方法及装置