[发明专利]文档处理装置以及文档处理和识别系统在审
申请号: | 201710203265.5 | 申请日: | 2017-03-30 |
公开(公告)号: | CN106991391A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 曹永刚;王晓珂 | 申请(专利权)人: | 理光图像技术(上海)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T1/00 |
代理公司: | 上海德昭知识产权代理有限公司31204 | 代理人: | 郁旦蓉 |
地址: | 200233 上海市徐汇区漕*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 处理 装置 以及 识别 系统 | ||
技术领域
本发明涉及一种文档处理装置和含有该文档处理装置的处理和识别系统。
技术背景
在公司、行政机关、科研机构等单位经常需要对纸质的印刷文档,比如商业合同、法律文书、行政文件等进行来源标识,即通过在印刷文档上添加表示该文件是由谁制作、由谁保管、制作打印时间、文件系列号等标记来标识来对文件后续的分发、传递过程中出现的泄漏进行追溯和管理。
比如,在政府机关中,如果要对某一份限量分发的机密文档进行标识,通常的做法是在该文件上添加表示文档制作者、文档保管者、文档编号的字符或是编码有这些信息的图形码,如将以上字符或是图形码(条形码、二维码等)直接添加在页眉或页脚处,或者直接在文件上添加图像水印。一旦某份文件被拍照、复印或是传真而泄漏出去,就可以通过识别泄露出去的文件上的标识来进一步追踪该被泄露的文件的源头。
然而,无论是使用可以直接辨识的文字字符或是需要进行解析的图形码或是直接添加在整个印刷文档页面上的水印,都是肉眼可见的,很容易通过后续的技术操作将这些字符、图形水印或是图形码移除,从而使得上述的方法无法对泄密的印刷文档进行追根溯源,无法起到预定的文档追溯的目的。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种能够将来源信息添加到文档中,使得肉眼不可见而又能够通过反向的处理解析来得到添加的来源信息的文档处理装置,以及含有该文档处理装置的文档处理和识别系统。
本发明为了实现上述目的,采用了以下结构:
<结构一>
本发明提供一种文档处理装置,用于将文档来源信息添加到文档中,其特征在于,包括:画面存储部,至少存储有来源信息输入提示画面、扫描框设定画面;显示输入部,显示来源信息输入提示画面和扫描框设定画面,让用户输入来源信息和扫描框的属性值;来源信息转化部,将来源信息根据编码规则转化成对应的长度为N位二进制数码;扫描框设定部,接收用户输入的扫描框的各种属性值来设定用于对文档进行扫描的扫描条件;特定区域计数部,采用扫描条件对文档进行扫描,对符合扫描条件的特定区域进行计数,得到特定区域的数目M;处理侧区域分组部,将M个特定区域分成N组;以及文档处理部,将N位二进制数码与N组特定区域进行一一对应,当与该组对应的二进制数码为1时,根据预定规则对对该组中的所有的特定区域中的黑白像素点进行处理,当与该组对应的二进制数码为0时,保持该组中的所有的特定区域中的黑白像素点不变。
<结构二>
进一步地,本发明还提供一种文档处理和识别系统,其特征在于,包括:文档预处理装置,用于对文档像素进行黑白二值化转化,得到黑白像素的二值化文档;文档处理装置,用于将文档来源信息添加到二值化文档中;以及文档识别装置,用于从添加了来源信息的二值化文档中识别出来源信息,其中,文档处理装置为具有上述特征的文档处理装置,文档识别装置具有:特定区域计数部,采用扫描条件对二值化文档进行扫描,对符合扫描条件的特定区域进行计数,得到特定区域的数目S;区域分组部,将S个特定区域分成N组;图像变换部,对N组中的特定区域进行图像变换;高频分量计算部,计算经过图像变换后的每一组特定区域内的高频分量超过1.0所占的比例;判定部,当高频分量超过1.0所占的比例大于或等于判定阈值T时,判定该组特定区域所对应的二进制数码为1,否则判定为0;二进制数码输出部,依次排列判定部的判定结果,得到N位长度的二进制数码;来源信息解析输出部,对得到的N位长度的二进制数码依照编码规则进行转换后输出,得到来源信息,判定阈值T满足50%≤T≤100%。。
发明的作用与效果
根据本发明涉及的文档处理装置,因为显示输入部能够显示预先存储在画面存储部中的来源信息输入提示画面和扫描框设定画面,显示来源信息输入提示画面和扫描框设定画面,让用户输入来源信息和扫描框的属性值,来源信息转化部能够将来源信息根据编码规则转化成对应的长度为N位的二进制数码,扫描框设定部能够接收用户输入的扫描框的各种属性值来设定用于对文档进行扫描的扫描条件,处理侧特定区域计数部能够采用扫描条件对文档进行扫描,对符合扫描条件的特定区域进行计数,得到特定区域的数目M,处理侧区域分组部能够将M个特定区域分成N组,文档处理部能够将N位二进制数码与N组特定区域进行一一对应,当与该组对应的二进制数码为1时,根据预定规则对对该组中的所有的特定区域中的黑白像素点进行处理,当与该组对应的二进制数码为0时,保持该组中的所有的特定区域中的黑白像素点不变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于理光图像技术(上海)有限公司,未经理光图像技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710203265.5/2.html,转载请声明来源钻瓜专利网。