[发明专利]一种适用于文本文档的生成式图像压缩方法及装置有效
| 申请号: | 201910059573.4 | 申请日: | 2019-01-22 |
| 公开(公告)号: | CN109783776B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 刘丹;陈亚军;王少康 | 申请(专利权)人: | 北京数科网维技术有限责任公司 |
| 主分类号: | G06F40/151 | 分类号: | G06F40/151;G06T11/00;G06T9/00;G06F17/16 |
| 代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 朱健;张国香 |
| 地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 适用于 文本 文档 生成 图像 压缩 方法 装置 | ||
本发明涉及信息处理领域,尤其涉及一种适用于文本文档的生成式图像压缩方法及装置。包括如下步骤:(1)将文本文档转换为RGB位图;(2)根据文本文档特征来预构建颜色表;(3)对RGB位图进行映射索引,使用每个像素RGB值与颜色表进行映射,在颜色表中寻找最接近的颜色值,确定对应的索引色,并记录索引号,组成索引色图像;(4)按LZW或其他数据压缩算法对图像数据区进行压缩,形成最后的图像文件。通过本发明的图像压缩方法,适应性的对文件公文进行合理的滤波、去噪、尽可能在图片扫描和压缩过程中保留原始文字和颜色信息,去噪简单速度快,文件转换算法易于编程,比较适用于公文文档类像素颜色复杂度不高的文件存储工作。
技术领域
本发明涉及信息处理领域,尤其涉及一种适用于文本文档的生成式图像压缩方法及装置。
背景技术
随着信息技术的发展,历史遗存了大量的纸质公文档案需要进行数字化,常见的方式是以扫描图像的形态来保存;同时电子公文作为一个严肃内容载体,其展现形态有其固定的格式,采用图像格式作为公文文档的载体进行信息公开及共享,在便利性及准确性方面可以取得较好的平衡。
目前的图像压缩算法并未针对公文类图像进行优化,本发明描述的一种生成式图像压缩方法,适用于文本文档产生的图像文件,可在保持原有显示效果的基础上,有效压缩图像文件体积,有利于文件的共享利用。
公文是党政军和企事业单位机关实施领导、履行职能、处理公务的具有特定效力和规范体式的文书,是传达贯彻方针政策,公布法规和规章,指导、布置和商洽工作,请示和答复问题,报告、通报和交流情况等的重要工具。公文以及类似文档有以下特征:
(1)内容主要是文字和图表,较少出现彩色图片;
(2)文档整体颜色域简单,只有少数几种颜色取值;
我们称之为为文书类文档。
相当多的文书类文档有公开发布的需求,公开发布使用何种格式作为文本文档载体是一个重要课题,许多研究和方案集中于如何尽可能减少对阅读终端的环境需求,即不要求文档的阅读终端具备特定的硬件和软件。图像是一种被广泛支持的电子文件格式,大多数的终端如PC、移动终端、手机等有丰富的软件支持图像格式,甚至连各类终端上的网页浏览器和PDF阅读器也支持图像格式,因此选用图像作为文档发布的承载格式或格式核心,对阅读终端的要求可被降低到最小。文档转换为图像发布解决了受众终端阅读的问题,但仍需要在此基础上提出优化方案,强化其优点,有效弥补其短板。
相同内容的图像与文本文件相比,其体积增加数倍甚至数十倍,因此,尽量压缩待发布图像文件的体积成为图像发布方案的重要组成部分。本发明描述的一种图像压缩方法,适用于文书文档产生的图像文件,可在原有基础上有效压缩图像文件体积。
发明内容
本发明的目的在于提供一种适用于文本文档的生成式图像压缩方法。
本发明的目的还在于提供一种适用于文本文档的生成式图像压缩装置。
本发明的目的可实现的方式是:
一种适用于文本文档的生成式图像压缩方法,包括如下步骤:
(1)将文本文档转换为RGB位图;
(2)根据文本文档特征来预构建颜色表;
(3)对RGB位图进行映射索引,使用每个像素RGB值与颜色表进行映射,在颜色表中寻找最接近的颜色值,确定对应的索引色,并记录索引号,组成索引色图像;
(4)按LZW或其他数据压缩算法对图像数据区进行压缩,形成最后的图像文件。
所述的将文本文档转换为RGB位图包括:
根据文本文档的扫描图像YUV参数构建RGB位图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数科网维技术有限责任公司,未经北京数科网维技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910059573.4/2.html,转载请声明来源钻瓜专利网。





