[发明专利]一种基于自动编码器和DTW的手绘图人体运动检索方法有效
| 申请号: | 201710377338.2 | 申请日: | 2017-05-25 |
| 公开(公告)号: | CN107169117B | 公开(公告)日: | 2020-11-10 |
| 发明(设计)人: | 肖秦琨;楚超勤;高嵩 | 申请(专利权)人: | 西安工业大学 |
| 主分类号: | G06F16/783 | 分类号: | G06F16/783;G06K9/00;G06K9/62;G06T7/11;G06T7/246;G06T7/90 |
| 代理公司: | 西安弘理专利事务所 61214 | 代理人: | 胡燕恒 |
| 地址: | 710021 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 自动 编码器 dtw 绘图 人体 运动 检索 方法 | ||
1.一种基于自动编码器和DTW的手绘图人体运动检索方法,其特征在于,具体按照以下步骤实施:
步骤1:使用相应设备拍摄单目视频,拍摄速度为30帧每秒,构建有N个类别的动态人体运动序列数据库V(1)=(V1(1),…,VN(1))及M个类别人体运动骨架手绘图序列数据库V(2)=(V1(2),…,VM(2));
步骤2:提取动态人体运动序列数据库V(1)的每帧图像,得到帧图像Fi=(fi1,...,fin),其中n表示动态人体运动序列数据库V(1)的帧数,对fij进行预处理,通过背景差分和肤色模型获取出fij中运动轮廓,通过人体骨架提取法获得运动骨架;
步骤3:通过系统学习获取基于模糊c-均值聚类的代表性帧图像数据库DRF;
步骤4:代表性帧图像数据库DRF通过使用自动编码器提取人体骨胳运动图像特征;
步骤5:应用画板手绘预查询的人体运动序列,首先应用自动编码器提取手绘图序列特征,进而应用模糊聚类获取手绘图运动序列代表帧应用DTW算法计算RFX和代表性帧图像数据库DRF距离,根据相似距离顺序排序,输出最优运动检索结果;
所述的步骤2具体按照以下步骤实施:
(21)使用Kinect获取人体运动的RGB彩色与深度图像,去除RGB彩色与深度图像噪声,并对其进行图像校正处理;
(22)根据彩色图像背景的复杂程度采用不同方法去除背景,获得前景彩色图像;
(23)基于前景彩色图像且依据肤色模型对脸部及手部进行定位并将脸部及手部定位质心作为初始获取的关节点;
(24)基于学习得到的贝叶斯分类器对彩色图像前景中的运动人体进行部件分类识别;
(25)依据分类识别结果判定肢体各刚体结构部位类别,再根据各刚体部件的连接关系确定出各关节点,依次连接各关节点形成平面人体骨架,结合各个关节点深度数据将平面骨架变换成三维立体骨架;
所述的步骤3具体按照以下步骤实施:
(31)给定运动序列{Fi}i=1:n,其中n是帧数,使用模糊c-均值FCM聚类方法生成代表性帧;
(32)基于帧图像Fi=(fi1,...,fin)聚类获取运动序列代表性的帧RF(1)i=(rf1(1),…,rfk(1)),并对V(2)手绘图数据库进行聚类处理,获得手绘图关键帧图像RF(2)j=(rf1(2),…,rfk(2)),然后总的代表帧可以表示为RF={rfk}k=1:c,其中rfk对应于第k个聚类中心;
(33)所有视频运动类别及手绘图所对应的代表性帧图像共同组成人体运动代表性帧图像数据库DRF={RF(1)i,RF(2)j};
所述的步骤4具体按照以下步骤实施:
(41)假设自动编码器的输入为x,首先,该编码器将原始信号x映射到特征信号z中:
z(e)=h(e)(W(e)x+b(e))
其中“(e)”是指神经网络编码层,h(e)是传递函数,W(e)是加权矩阵,b(e)是偏置向量;
(42)解码器将特征信号z映射返回到估计中:
其中“(d)”表示第d网络层,h(d)是解码器的传递函数,W(d)是权重矩阵,b(d)是偏置向量;
(43)建立一个代价函数来描述输入,表示为x,与其重建之间的误差输出,表示为并需要控制误差的值最小
其中代价函数E由3部分组成,第1部分是均方误差,第2部分l*Wweights是L2正则化,第3部分b*Wsparsity是稀疏正则化,L2正则化系数为l,稀疏正则化系数为b,如果让L2正则化是:
其中L,n,k分别是训练数据中的隐层数,观测数和变量数,添加一个正则化来激励稀疏项,将第i个神经元激活措施定义为:
其中n是训练样本数,xj是第j个训练样本,wi(1)T和bi(1)分别是W(1)的第i行,偏移向量,接下来,利用Kullback Leibler发散呈现稀疏正则化:
当ri和相等,Kullback Leibler发散是0,否则,由于它们彼此偏离,发散是较大的。
2.根据权利要求1所述的一种基于自动编码器和DTW的手绘图人体运动检索方法,其特征在于,所述的步骤5具体按照以下步骤实施:
(51)DTW的目的是比较两个序列和RFY=(rf1Y,…,rfcY)之间的相似性,让整体匹配代价为Cp(RFX,RFY):
CP(RFX,RFY)=[dDTW(rfiX,rfjY)]c×c
在RFX和RFY之间的一个规整路径p,被定义为本地代价度量,而dDTW(rfiX,rfjY)是rfiX与rfjY,i,j=1,…,c,之间的DTW,设定rfiX和rfjY是t维向量,并且rfiX=(x1,…,xt)和rfjY=(y1,…,yt),rfiX和rfjY之间的DTW是:
(52)RFX和RFY之间的最佳规整路径是在所有可能的规整路径中具有最小总成本的规整路径然后定义RFX和RFY之间的距离是的总成本:
(53)为了确定最优路径使用动态规划获得最优路径,累积成本矩阵D满足以下等式:
且n∈[1:c],D(1,m)=∑mk=1 dDTW(rf1X,rfkY)有m∈[1:c],和:
D(n,m)=min{D(n-1,m-1),D(n-1,m),D(n,m-1)}+dDTW(rfnX,rfmY),
最终优化DTW的距离是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安工业大学,未经西安工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710377338.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:默认搜索词的生成方法及装置
- 下一篇:一种快速的城市信息检索系统





