[发明专利]基于GA-BP网络的机器人行为校验识别方法有效
| 申请号: | 202010214583.3 | 申请日: | 2020-03-24 |
| 公开(公告)号: | CN111401527B | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 司海飞;胡兴柳;史震;方挺 | 申请(专利权)人: | 金陵科技学院 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N3/12;G06V40/20;G06V10/30;G06V10/82 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 蒋昱 |
| 地址: | 210000 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 ga bp 网络 机器人 行为 校验 识别 方法 | ||
1.基于GA-BP网络的机器人行为校验识别方法,具体步骤如下,其特征在于;
Step1:采集数据;
针对于机器人动作库储存的动作{action_1、action_2、...、action_N},其中N为动作库中储存的动作数,分别做每种动作的数据100次,采用Kinect平台采集每次动作中人体的27关节点的弧度数据{radian_1、radian_2、...、radian_27},采样时间为3s,其中采集步长为0.2s;
Step2:使用最小二乘法对关节点弧度数据进行滤波;
建立关节点弧度数据radian_1与采集时步t的三次项关系式;
y=a0+a1x+a2x2+a3x3
其中a0、a1、a2、a3为多项式各系数,y对应关节点弧度数据radian_1,x对应采集时步t,设定动态时窗为1s,每个时窗内包含5个点,五个点分别为;
(x-2,y-2),(x-1,y-1),(x0,y0),(x1,y1),(x2,y2),将五个点的坐标一一代入,即有方程组
基于最小二乘法,方程组可转为;
上列方程组可用矩阵表示为Y5×1=X5×4·A4×1+E5×1;
解得A的最小二乘解则滤波后的值;
从而对关节点弧度数据radian_1数据平滑与降噪,同理,对关节点弧度数据radian_2、…、radian_27进行平滑与降噪处理;
Step3:建立BP神经网络行为校验识别模型;
所使用的神经网络为三层BP神经网络,分别为输入层、隐含层和输出层,使用滤完波的27关节点弧度数据,为缩小BP网络输入层节点数,每3个时步取平均数,则动作序列变短为5个时步的序列,每组动作共有5*27=135,分别对应输入向量元素x1,x2,…,x135; 由于各数据参数单位不同,数量级相差也比较大,为了网络的收敛性更佳,需将输入数据进行归一化处理,即所有的输入向量取值都在0-1之间,网络的输入向量为分别表示6个特征向量归一化处理后的值,即
其中,为归一化后的特征值;xi为第i个特征值,xmax,xmin分别为xi中的最大值和最小值,针对输出层,对样本“ONE-HOT”处理,即输出动作匹配的得分向量Yi为元素数为N的向量,当该动作序列为action_1时,则对应的第一个向量元素为100,作为匹配得分,则其他元素为0,其他动作序列类别以此类似;
隐含层第j个神经元输出为
其中ωij表示输入层神经元i与隐含层神经元j之间的连接权值,aj表示隐含层神经元j的阈值,g()是隐含层神经元的激活函数,采用Sigmoid函数,形式为
输出层第k个神经元输出为
其中μjk表示隐含层神经元j与输出层神经元k之间的连接权值,bk表示输出层神经元j的偏置值;
下面对上述BP网络进行训练学习:任取层与层之间的连接权值和隐层、输出层节点的偏置为(-1,1)之间随机小量,学习率η一般在[0.3~0.5]之间,选取η=0.34;
Step4:使用遗传算法改进BP神经网络行为校验识别模型;
为进一步提升BP网络的收敛速度和校验识别精度,使用遗传算法对上述BP神经网络行为校验识别模型进行优化;
并采用步骤1中采集后的行为动作样本序列数据,并经过步骤2滤波后,最终获得最优连接权重和阈值;
步骤Step4具体步骤如下:
由于BP神经网络的权值和阈值均需要搜索,为便于计算采用实数编码,每个个体均为一个实数串,包含输入层与隐含层连接的权值及隐含层阈值、隐含层与输出层连接的权值及输出层阈值,选取0.6为交叉概率,迭代次数为100,种群大小为50;
建立适应度函数为
其中,n为训练样本总数;将和yij分别为第j个机器人模仿学习中行为动作样本的第i个网络输出节点的理想输出和实际输出;q为遗传算法优化BP网络输出神经元的个数;
Step5:机器人行为实时校验识别;
实时通过Kinect采集人体的关节点弧度数据,经过滤波处理后,使用上述训练好的GA-BP神经网络模型进行计算获得动作序列的得分向量做阈值判断,当得分向量中元素的最大值大于阈值point时,则判定动作库包含该动作,机器人提示用户,并告知元素的最大值对应的动作,调用该动作完成控制,若最大值小于等于阈值point,则进行机器人的模仿学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金陵科技学院,未经金陵科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010214583.3/1.html,转载请声明来源钻瓜专利网。





