[发明专利]基于多任务度量多核学习的室内RGB‑D场景图像识别方法在审

申请号：	201710318192.4	申请日：	2017-05-08
公开（公告）号：	CN107341440A	公开（公告）日：	2017-11-10
发明（设计）人：	牛振兴;郑昱;焦志成;徐浩隽;亓林	申请（专利权）人：	西安电子科技大学昆山创新研究院
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04
代理公司：	西安智萃知识产权代理有限公司61221	代理人：	李东京
地址：	215300 江苏省苏州市昆***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于任务度量多核学习室内 rgb 场景图像识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于多任务度量多核学习的室内RGB-D场景图像识别方法，其特征在于：该方法包括以下步骤：

步骤一，将室内RGB-D场景图像训练集中的每一幅RGB-D场景图像的每一张彩色图像和与彩色图像对应的深度图像通过卷积神经网络分别提取彩色图像特征和对应深度图像特征；

所述彩色图像特征和对应深度图像特征均为全局特征；

步骤二，通过多任务度量学习方法构建映射函数，得到特征映射矩阵，然后将所述彩色图像特征和所述对应深度图像特征同时通过所述特征映射矩阵映射到修正特征空间中，并得到修正彩色图像特征和修正深度图像特征；

步骤三，将所述修正彩色图像特征和所述修正深度图像特征一一对应，然后将所述修正彩色图像特征和所述修正深度图像特征的特征向量拼接为一个特征向量，形成修正RGB-D图像特征；再通过多核学习方法，对修正RGB-D图像特征进行学习，得到多核室内场景分类器模型；

步骤四，通过步骤一将待识别的室内RGB-D场景图像提取待识别彩色图像特征和待识别对应深度图像特征，然后通过步骤二中的所述特征映射矩阵将待识别彩色图像特征和待识别对应深度图像特征映射到修正特征空间中并形成待识别修正彩色图像特征和待识别修正深度图像特征，并将待识别修正彩色图像特征和待识别修正深度图像特征一一对应并拼接成待识别修正RGB-D图像特征，最后将待识别修正RGB-D图像特征输入到所述多核室内场景分类器模型中，得到分类结果，完成室内场景图像的识别。

2.根据权利要求1所述的基于多任务度量多核学习的室内RGB-D场景图像识别方法，其特征在于：所述步骤二的具体步骤为：

(1)通过多任务度量学习构建用于衡量两个不同彩色图像或两个不同深度图像的距离的度量函数，距离度量函数为：

dt(xi,xs)=(xi-xs)T(M0+Mt)(xi-xs)]]>

其中，x_i表示一个彩色图像样本或深度图像样本，x_s表示与x_i不同的一个彩色图像样本或深度图像样本，d_t表示两个不同彩色图像样本之间的马氏距离或两个不同深度图像样本之间的马氏距离；T表示完成同一室内场景识别的任务的数量，且T＝2；M₀表示公共度量矩阵，M_t表示所述完成同一室内场景识别的任务私有的度量矩阵，M₀+M_t表示多任务度量学习中彩色图像或深度图像的度量矩阵，且M₀+M_t＝L^ΤL，L为所述特征映射矩阵；

其中，所述完成同一室内场景识别的任务包括使用彩色图像特征完成室内场景识别的任务和使用对应深度图像特征完成室内场景识别的任务；

t＝1或2，当t＝1时，M₁表示使用彩色图像特征完成室内场景识别的任务私有的度量矩阵，当t＝2时，M₂表示使用对应深度图像特征完成室内场景识别的任务私有的度量矩阵；多任务度量学习中的彩色图像的度量矩阵为M₍₁₎＝M₀+M₁，多任务度量学习中的深度图像的度量矩阵为M₍₂₎＝M₀+M₂；

(2)构造优化函数学习公共度量矩阵M₀和私有的度量矩阵M_t，优化函数为：

minM0,...,MTγ0||M0-I||F2+Σt=1T[γt||Mt||F2+Σi,jdt2(xi,xj)+Σi,j,kξi,j,k]]]> 1