[发明专利]一种无标记平面物体识别的优化算法有效

专利信息
申请号: 201410151036.X 申请日: 2014-04-15
公开(公告)号: CN103903013A 公开(公告)日: 2014-07-02
发明(设计)人: 金城;贾琼;冯瑞;薛向阳 申请(专利权)人: 复旦大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 上海正旦专利代理有限公司 31200 代理人: 陆飞;盛志范
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 标记 平面 物体 识别 优化 算法
【权利要求书】:

1.一种无标记平面物体识别的优化算法,其特征在于依次分为3个阶段:离线训练阶段,在线识别阶段,增强现实阶段;

一、离线训练阶段的具体步骤为:

(1)自动合成训练样本

直接以目标平面物体的一张无遮挡图像作为素材,采用自动合成的方法生成训练集;具体采用仿射变换的方法从目标平面物体的初始视图生成新的随机视图,并加入白噪声;这里合成训练集大小为S,使用随机方法合成的视图,作为分类器的训练样本;

(2)筛选稳定的关键点集  

第一步:将关键点提取问题转化为关键点类和非关键点类的二分类问题,对图像上所有像素点进行快速分类:

选取待测像素点m,其以R为半径的圆周上像素点,随机挑选圆周上过直径的两个像素点,对其灰度值进行以下计算:

且           (1)

其中为经过预处理的图像,m点为待测像素,d为单位向量,R为半径,为该直径与水平直径的夹角,??为4;一旦随机选定的直径上像素点灰度值满足上式,则m点立刻被分类为非关键点,同时直径上两个像素点也被分类为非关键点,若经过4次挑选测试后,m仍未被分类为非关键点,则该点有可能为关键点,将其加入关键点候选集合;

第二步:通过上一步将所有像素遍历后,得到关键点候选集合;使用高斯-拉普拉斯金字塔评分机制对候选关键点评分,近似表达式为:

             (2)

以此评分结果作为衡量模型图像候选关键点特征稳定性和显著性的基本标准;

其中,对原始图像进行不同尺度的高斯卷积运算,并进行降采样操作,得到不同尺度的图像组成高斯金字塔,为金字塔的层数,这里是4; 

将高斯金字塔的尺度信息加入关键点候选的评分标准,调整评分如下:

   (3)

以此评分结果作为衡量候选关键点的最终标准;

通过统计每个关键点在训练样本中被检测到的次数,将检测次数最多的点集作为最终选定的关键点集;针对模型的关键点候选的评分标准为:

 (4)

其中表示第j个合成样本中点是否在关键点候选集合,当其在候选集合内时值为1,反正则为0 ;

(3) 采用半朴素贝叶斯分类器进行分类

(a).使用以关键点为中心的邻域纹理作为该类的描述,该邻域为边长32像素的正方形面片;从自动合成的S个样本中提取关键点以及面片,作为各类关键点的训练样本集;

(b).选择基于随机Ferns的半朴素贝叶斯分类器  

使用基于生成型模型的朴素贝叶斯模型建立分类器,依赖多个特征向量对一个类变量进行分类;

使用关键点邻域面片上像素点对之间的灰度值明暗比较结果作为该关键点特征;这里使用随机算法抽取像素点对,基于随机像素位置的比较得到的特征值,组合成特征向量,最后使用分类器训练出每个特征值对应的各关键点的分类后验概率分布;

(c).分类器的核心算法如下:

设ck, k=1,…,H,作为类的集合,将欲分类的面片由一组特征{fj},j=1,…, N表示,fj表示面片上进行像素点对mj,1和mj,2测试的二进制特征值如式(5),其中表示灰度图像:

                     (5)

分类器的目的是找到面片中概率最大的分类号C,如式(6):

                         (6)

将面片输入分类器中,以特征值代表面片,(6)式等价为(7)式:

                   (7)

由贝叶斯公式知:

                 (8)

其中,右式分母与分类无关,分子的P(C=ck)因子视作常数,因此(7)式近似为:

                 (9)

将N个特征分成M组,假设M组之间的特征独立性,匹配问题最终转化为式(10):

                    (10)

训练阶段将训练样本提取的面片输入到分类器中分类,统计随机森林每个叶子节点上各类的概率分布并对其归一化,最终得到各类在各特征值下的后验概率分布;

二、在线识别阶段的具体步骤为:

(1)关键点提取

提取方法同离线训练阶段的筛选稳定的关键点集的关键点提取方法,以式(3)为关键点的度量标准; 

(2)分类器分类,将目标帧转化为灰度图,提取关键点

针对每个关键点,将其面片输入训练好的分类器中,据(10)式选择后验概率最大的类作为该关键点的匹配,以此概率作为匹配的基本得分;

(3)单应性矩阵估计,使用经典的拟合算法RANSAC即随机抽样一致性算法筛选内点集,并估计模型在目标中的位姿矩阵;

(a)拟合算法RANSAC定义如下:已知计算出目标物体到模型的转换矩阵所有参数,所需最少匹配数为3;每次迭代从匹配全集中随机选取3个匹配,解出一个初始单应性矩阵,进而从匹配全集中找到所有一定误差允许范围内满足此单应性矩阵的所有匹配,称为支撑集;当支撑集大小达到一定阈值时,则认为支撑集足够大,所有匹配为内点,以此支撑集更新初始单应性矩阵;否则重新迭代;在RANSAC之后使用Levenberg-Marquardt最小二乘估计更新并得到最终单应性矩阵;

(b)改进的拟合算法ARANSAC, 将匹配的得分作为确定新的初始随机范围的依据;目标关键点在分类器中分类时,分值最高模型关键点被匹配;反之,所有与模型关键点的匹配中,目标关键点纹理最类似的得分更高;所以在全部最高得分的匹配中,内点的概率将高于其在匹配全集中的比例;

将全部得分中最高与最低分的一个中间值作为阈值,使用所有得分的算术平均值作为阈值,只有高于该阈值才作为初始集的候选匹配;对匹配全集参照得分进行排序,高于阈值的匹配进入候选集,其他匹配只用于支撑集;采用针对阈值的快速排序算法,遍历匹配集合一次完成排序;此阶段完成后,若成功检测到目标,则得到待检测图像上目标平面物体的位姿矩阵;

三、在线增强现实阶段 

使用OpenGL把一个3D物体实时增强于识别的无标记平面物体上,需要对以下几个矩阵进行操作:(1)投影矩阵转换;(2)模型矩阵转换;其中:模型矩阵,是指对模型视景中模型的位置进行矩阵操作,即将模型以固定的姿态固定的位置至于场景中,之后即使场景发生改变,模型仍保持在场景的相对位置固定;投影矩阵,是指对当前场景进行投影变换,即人的视点在变换,看到的场景视图就不同,现在就是对场景视图进行从人眼角度的重新投影;

使用一张风景画实时增强到目标物体的位姿上,其步骤如下:(1)识别阶段中得到目标物体的位姿矩阵,将此设为投影矩阵;(2)设定模型矩阵,模型位于场景中中心部分,景深-90,风景画平面法向量方向与z轴重合;(3)翻转投影矩阵,因为之前求得的转换矩阵和人眼观察到的旋转平移矩阵是互逆的;(4)场景景深z的范围为100到1000000;(5)场景背景设置为实时输入帧,将风景画贴合在场景中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410151036.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top