[发明专利]一种基于单节点光子储备池计算的动作视频识别方法有效
申请号: | 202110597541.7 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113343813B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 李璞;胡春强;蔡强;开超;李佳一 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06V10/50;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 太原晋科知识产权代理事务所(特殊普通合伙) 14110 | 代理人: | 王军 |
地址: | 030024 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 节点 光子 储备 计算 动作 视频 识别 方法 | ||
本发明涉及一种基于单节点光子储备池计算的动作视频识别方法,单节点光子储备池计算仅包含一个物理节点,结构简单,硬件友好,使用简单的线性回归算法如岭回归训练输出连接权重,训练成本低;本发明使用高非线性光纤有效提高单节点光子储备池计算储备池层的非线性动力学响应丰富度,使储备池维度最大化,提高系统性能。每一个纵模之间并行处理信息,每一个纵模功能等价于一个子储备池层。使用多纵模响应激光器的多个纵模并行处理信息,虚拟节点数和处理速率倍数提高,增加系统容量;该单节点光子储备池计算在光域中处理和传输信号,不会受限于电子速率瓶颈,结合了光信息处理的高速大容量特性。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种基于单节点光子储备池计算的动作视频识别方法。
背景技术
机器视觉是人工智能的重要分支,近年来发展非常迅速。由于机器视觉的显著优势,如:可观测范围广、精度高、智能化水平显著、对作业环境的鲁棒性,并且其往往不需要直接接触被探测物体因而不会对被测物体造成损坏等。机器视觉已经被广泛用于许多领域,例如机器人视觉、工业检查、交通监控等。
人工神经网络在机器视觉领域显示出巨大潜力,具有与人脑相媲美的智能性。与其他机器视觉实现方法相比,人工神经网络具有更高的效率和更低的能耗。T.H.Sun等人使用基于反向传播神经网络的机器视觉系统可以自动对被研究案例公司的热熔断器进行检查,该系统可以替代4~6名人工检查员。R.K.C.Billones等人通过使用基于人工神经网络的机器视觉系统,自动识别并标记在交叉路口发生的交通违章事件,开发了城市道路交叉路口的交通违章事件管理系统。S.Penttila等人使用基于人工神经网络的机器视觉系统,实现了人工智能气体保护金属电弧焊系统参数的自适应控制。然而基于这些传统人工神经网络的机器视觉实现方法需要大量物理节点的大规模随机互连,这就存在训练成本高,硬件实现困难的问题。
储备池计算(reservoir computing,RC)由于其高效及硬件友好等主要优点,成为人工神经网络的一个研究热点。储备池计算通常由输入层、储备池层和输出层三部分构成,仅输出连接权重需要使用简单的训练算法(例如岭回归)进行训练,而输入连接权重和内部连接权重则是随机产生并固定的。与基于神经网络硬件或神经形态硬件的先进技术等其他人工神经网络相比,储备池计算避免了大规模互连的问题,因此储备池计算在硬件实现方面更有潜力。
根据储备池层的结构,储备池计算可分为传统的多节点储备池计算和单节点储备池计算两种类型。传统的多节点储备池计算在其储备池层中有大量的物理节点,这些节点由随机生成并固定的稀疏矩阵连接,输入层通过类似的矩阵将输入信号注入储备池中,输入信号在储备池层中经过不同节点的作用发生非线性映射,最后将每个节点的瞬态响应与训练好的输出连接权重相乘,得到目标结果。上述运算过程复杂繁冗,不利于视频图像的快速识别。
发明内容
本发明为了解决上述提到的问题,提供了一种基于单节点光子储备池计算的动作视频识别方法。
本发明解决其技术问题所采用的技术方案是:构造一种基于单节点光子储备池计算的动作视频识别方法,包括:
基于KTH数据库获取标记好的人体动作视频并进行帧提取,并将标记好的人体动作帧图像划分为训练集和测试集;
构建基于单节点光子储备池计算的视频动作识别网络模型,视频动作识别网络模型包括输入层、储备池层和输出层;通过所述输入层对输入的人体动作帧图像进行预处理,储备池层为带有光放大器、高非线性光纤和自延迟反馈环的多纵模激光器,通过调节光放大器和高非线性光纤使得展宽的光谱覆盖多纵模激光器的所有纵模,对经过预处理的人体动作帧图像进行高维非线性映射;输出层用于输出识别结果;
将作为训练集的人体动作帧图像输入视频动作识别网络模型进行参数调整,至输出的结果为准确识别结果为止,训练完成后将作为测试集的人体动作帧图像输入视频动作识别网络模型,验证视频动作识别网络模型的识别准确性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110597541.7/2.html,转载请声明来源钻瓜专利网。