[发明专利]一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法在审
申请号: | 201611109497.6 | 申请日: | 2016-12-06 |
公开(公告)号: | CN106780328A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 朱荷艳 | 申请(专利权)人: | 烟台大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T3/00 |
代理公司: | 济南诚智商标专利事务所有限公司37105 | 代理人: | 郑宪常 |
地址: | 264003 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 手机 摄像头 拍摄 照片 自动 拼接 文档 扫描 方法 | ||
1.一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法,其特征在于,包括以下步骤:
1)、使用手机摄像头按照水平方向从左到右、垂直方向从上到下的顺序依此拍摄需要扫描的文档的若干幅照片,所拍摄的照片在水平方向和垂直方向上均要求相邻的两张照片之间有重叠,所拍摄照片根据拍摄时间编号存储;
2)、对所拍摄照片进行预处理,预处理主要分为两个方面,一个是照片方向矫正,一个是照片格式转换:如果照片方向为左/右/下,则旋转90度,将iOS手机拍摄的照片格式由UIImage格式转换为JPEG格式;
3)、对所拍摄照片利用SIFT算法找到关键点及其对应的描述子;
4)、对相邻两张照片中的关键点进行特征匹配;
5)、对相邻两张照片进行拼接,查询按照一定方向性是否完成全部拍摄照片的拼接,是,将拼接照片作为最终生成的整个文档的电子版扫描件输出,否,跳转到步骤4)。
2.如权利要求1所述的一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法,其特征在于,所述步骤3)中,对所拍摄照片利用SIFT算法找到关键点及其对应的描述子包括以下步骤:
1)、对于每一张照片,使用高斯差分算子对图像的每一个像素点进行变换,看其是否比图像域和尺度域的相邻点大/小来寻找它的极值点,通过比较该像素点和其周围所有的相邻像素点,如果该像素点是一个极值点,则将该像素作为一个关键点;
2)、以作为关键点的该像素点为中心,采样16x16大小的图像块,计算该图像块内256个像素点在水平方向和垂直方向的梯度,将16x16大小的图像块分为无重叠的16个4x4的子块,使用每一个子块中所有像素的梯度计算一个8维的直方图,将所有16个子块的直方图拼接成一个128维的特征向量,作为该像素点的特征描述子。
3.如权利要求1所述的一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法,其特征在于,所述步骤4)中,对相邻两张照片中的关键点进行特征匹配具体步骤如下:在拼接相邻两幅照片A和照片B时,计算照片A中的任一关键点的特征描述子与照片B中所有的关键点的特征描述子的欧式距离,将距离最小的两个关键点作为成功匹配。
4.如权利要求1所述的一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法,其特征在于,所述步骤5)中,对相邻两张照片进行拼接具体步骤如下:
1)、以照片A为基准,每次从中随机选择8个关键点,在照片B中找出与照片A随机选择的8个关键点配对的8个关键点;
2)、用8对关键点的坐标计算得到一个对应矩阵,将照片A中剩余的关键点按照对应矩阵变换投影到照片B中,统计照片A与照片B配对点的个数;
3)、重复上述步骤1000次,得到准确配对最多的一个对应矩阵作为相邻两张照片的对应矩阵,并利用该对应矩阵将两张照片的相邻边界的所有像素点进行对应,从而得到拼接完成后的照片;
4)、重复上述操作直至完成全部照片的拼接工作。
5.如权利要求4所述的一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法,其特征在于,在进行拼接时,对于欲拼接的若干幅与文档位置相对应照片,按照从左到右、从上往下顺序依次进行拼接,开始拼接时,位于拍摄文档位置左上方的两幅照片之间进行拼接,将位于左方的照片作为拼接照片A,位于右方的作为拼接照片B,照片A与照片B拼接完成之后作为照片A继续与位于右方的照片B进行拼接,直至一行照片拼接完毕,将该行拼接完成照片作为照片A与位于下一行的左方位置照片继续拼接,循环直到完成全部照片拼接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台大学,未经烟台大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611109497.6/1.html,转载请声明来源钻瓜专利网。