[发明专利]一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法在审
申请号: | 201611109497.6 | 申请日: | 2016-12-06 |
公开(公告)号: | CN106780328A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 朱荷艳 | 申请(专利权)人: | 烟台大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T3/00 |
代理公司: | 济南诚智商标专利事务所有限公司37105 | 代理人: | 郑宪常 |
地址: | 264003 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 手机 摄像头 拍摄 照片 自动 拼接 文档 扫描 方法 | ||
技术领域
本发明属于图像处理与模式识别技术领域,尤其涉及一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法。
背景技术
随着数字化办公技术在人们工作和日常生活中的普及,如何将纸质文档迅速且高质量的转换成数字文档就变量日益重要起来。现有方法主要是依赖电子扫描设备,例如将一份A4大小的文件放在扫描仪中,扫描得到的输出为一张jpg格式的图片或者为一份PDF格式的文档。虽然这一主流的方法得到了广泛的使用,但仍然面临几个问题:
1)专业的扫描设备价格不菲,对于家庭日常使用来讲,增加了家庭生活开支的成本,且由于日常使用的频率较低,导致购买专业扫描设备的性价比不高,另外,专业设备体积较大,需要占据一定的空间,影响家庭生活的品质。
2)专业的扫描设备只能扫描大小一定的文档。例如,现有的办公扫描设备大多只适合扫描A4大小的文档,当需要扫描更大的文档时,普通的办公设备无能力为。
3)专业的扫描设备在扫描文档时,文字的清晰度不够。例如,将一份信用卡的申请表格扫描成电子版,表格中密集的小字体文字很难被扫描的十分清晰。
发明内容
本发明的目的是提供一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法,通过使用手机摄像头从不同角度拍摄一份文档的多幅照片,将有重叠部分的照片拼接到一起,生成一张完整、清晰的图片输出,减少硬件和环境对图片的不利影响。
一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法,包括以 下步骤:
1)、使用手机摄像头按照水平方向从左到右、垂直方向从上到下的顺序依此拍摄需要扫描的文档的若干幅照片,所拍摄的照片在水平方向和垂直方向上均要求相邻的两张照片之间有重叠,所拍摄照片根据拍摄时间编号存储;
2)、对所拍摄照片进行预处理,预处理主要分为两个方面,一个是照片方向矫正,一个是照片格式转换:如果照片方向为左/右/下,则旋转90度,将iOS手机拍摄的照片格式由UIImage格式转换为JPEG格式;
3)、对所拍摄照片利用SIFT算法找到关键点及其对应的描述子;
4)、对相邻两张照片中的关键点进行特征匹配;
5)、对相邻两张照片进行拼接,查询按照一定方向性是否完成全部拍摄照片的拼接,是,将拼接照片作为最终生成的整个文档的电子版扫描件输出,否,跳转到步骤4)。
进一步地,所述步骤3)中,对所拍摄照片利用SIFT算法找到关键点及其对应的描述子包括以下步骤:
1)、对于每一张照片,使用高斯差分算子对图像的每一个像素点进行变换,看其是否比图像域和尺度域的相邻点大/小来寻找它的极值点,通过比较该像素点和其周围所有的相邻像素点,如果该像素点是一个极值点,则将该像素作为一个关键点;
2)、以作为关键点的该像素点为中心,采样16x16大小的图像块,计算该图像块内256个像素点在水平方向和垂直方向的梯度,将16x16大小的图像块分为无重叠的16个4x4的子块,使用每一个子块中所有像素的梯度计算一个8维的直方图,将所有16个子块的直方图拼接成一个128维的特征向量,作为该像素点的特征描述子。
进一步地,所述步骤4)中,对相邻两张照片中的关键点进行特征匹配具体步骤如下:在拼接相邻两幅照片A和照片B时,计算照片A中的任一 关键点的特征描述子与照片B中所有的关键点的特征描述子的欧式距离,将距离最小的两个关键点作为成功匹配。
进一步地,所述步骤5)中,对相邻两张照片进行拼接具体步骤如下:
1)、以照片A为基准,每次从中随机选择8个关键点,在照片B中找出与照片A随机选择的8个关键点配对的8个关键点;
2)、用8对关键点的坐标计算得到一个对应矩阵,将照片A中剩余的关键点按照对应矩阵变换投影到照片B中,统计照片A与照片B配对点的个数;
3)、重复上述步骤1000次,得到准确配对最多的一个对应矩阵作为相邻两张照片的对应矩阵,并利用该对应矩阵将两张照片的相邻边界的所有像素点进行对应,从而得到拼接完成后的照片;
4)、重复上述操作直至完成全部照片的拼接工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台大学,未经烟台大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611109497.6/2.html,转载请声明来源钻瓜专利网。