[发明专利]一种基于局部特征和词袋模型人体动作识别过程的关键帧选取方法有效
申请号: | 201710329538.0 | 申请日: | 2017-05-11 |
公开(公告)号: | CN107220597B | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 王颖;吴峰 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 局部 特征 模型 人体 动作 识别 过程 关键 选取 方法 | ||
1.一种基于局部特征和词袋模型人体动作识别过程的关键帧选取方法,其特征在于:首先提取人体动作局部特征,将局部特征聚类映射为不同的视觉词汇,所有视觉词汇构成视觉词典;
计算每个人体动作视频所有视觉词汇出现的概率,得到视觉词汇分布特征向量直方图H=(h1,h2,...,hi',...,hn);其中hi'为第i'个视觉词汇在人体动作视频中出现的概率,n为视觉词典大小;将H作为描述人体动作视频的特征向量输入分类器进行动作识别;
该方法包括以下步骤:
步骤一设定初始参数
利用离散粒子群选取人体动作视频关键帧的初始参数设定包括:种群个数N,迭代次数M,随机粒子及速度:Xi,Vi,i=1,2,...,N;
其中,随机粒子Xi为二进制向量,长度等于原始人体动作视频帧数m;向量中元素值为1表示选取该帧为关键帧,否则为0;速度向量Vi的长度和Xi相同,向量中的每一项为0-1的随机数,表征随机粒子中元素为1的概率;
步骤二计算每个粒子的适应度值
采用原始人体动作视频和所有选取的关键帧对应的局部视觉词汇分布特征向量直方图的夹角余弦值作为适应度值,计算公式如下:
向量H表示原始动作视频的视觉词汇分布特征向量直方图,向量Hi表示随机粒子Xi选取的所有关键帧对应的局部视觉词汇分布特征向量直方图;
步骤三获得初始粒子群的最优适应度和最优粒子
计算每个粒子的适应度值后,初始粒子群的最优适应度为:
fmax=max(f(Hi,H)) (2)
最优适应度取值所对应的粒子Xi即为初始粒子群的最优粒子;
步骤四速度更新
对粒子群中所有粒子进行速度更新:
其中,Vik+1为第i个粒子第k+1次迭代后的速度,Vik为第i个粒子第k次迭代后的速度,为第i个粒子第k次迭代后的结果,pbest为粒子的个体最优解,即同一粒子在迭代过程中最优适应度取值所对应的粒子;gbest为种群全局最优解,即迭代过程中全局最优适应度值所对应的粒子;r1和r2为0-1之间的随机数;通过pbest及gbest修正粒子寻优路径,加速寻找最能表征人体动作特征的关键帧;
步骤五速度修正
速度向量中每一项对应粒子中相应位置元素为1的概率,因此为使得速度向量中的每一项的值在0到1之间,引入标准sigmoid函数进行速度修正:
其中,Vid为第i个粒子的速度向量Vi第d个元素的值,d=1,2,...,m;exp()为指数函数;V′id为速度向量Vi第d个元素修正后的速度值;
步骤六粒子更新
根据每个粒子的速度向量对粒子进行更新:
其中,Xid为粒子Xi中第d个元素的值,rand()为0-1间的随机数;
重复步骤四、步骤五、步骤六,当迭代次数达到步骤一中设置的迭代次数M时,gbest中所有值为1的项对应的位置即为人体动作视频选取的关键帧帧序。
2.根据权利要求1所述的一种基于局部特征和词袋模型人体动作识别过程的关键帧选取方法,其特征在于:
S1、设置初始参数
利用离散粒子群选取人体动作视频关键帧,设定种群个数N为50,迭代次数M为100,随机粒子及速度:Xi,Vi,i=1,2,...,50;
S2、计算粒子的适应度值
采用式(1)计算原始人体动作视频对应的局部视觉词汇分布特征向量直方图与每个粒子选取的关键帧对应的局部视觉词汇分布特征向量直方图的夹角余弦值作为粒子适应度;
S3、获得初始粒子群的最优适应度和最优粒子
利用式(2)求解初始粒子群的最优适应度,最优适应度取值所对应的粒子Xi即为初始粒子群的最优粒子;
S4、速度更新
利用式(3)对粒子群中所有粒子进行速度更新,利用标准sigmoid函数修正速度向量中的每一项;
S5、粒子更新
利用式(5)根据速度向量对粒子进行更新;重复S4、S5;当迭代次数达到S1中设置的迭代次数100时,gbest中所有元素值为1对应的位置即为人体动作视频选取的关键帧帧序;
S6、计算选取的关键帧的局部视觉词汇分布特征向量直方图
计算经过关键帧选取后的人体动作视频图像序列新的视觉词汇分布特征向量直方图,作为描述人体动作的特征向量利用分类器进行动作识别;
S7、人体动作识别
动作识别分类器采用支持向量机;核函数选择卡方核:
其中,Hj'分别为第i1个和第j个人体动作视频关键帧的特征向量直方图;为两个特征向量直方图的卡方距离:
其中,为第i1个和第j个人体动作视频特征向量直方图第k1个元素的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710329538.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双扉门设备用密封结构
- 下一篇:密封衬垫及弹性网管