[发明专利]一种基于深度学习的苹果采摘机器人果实目标检测方法在审

专利信息
申请号: 201710665266.1 申请日: 2017-08-07
公开(公告)号: CN107633199A 公开(公告)日: 2018-01-26
发明(设计)人: 王万良;鞠振宇;邱虹;杨平;应森亮;郑建炜 申请(专利权)人: 浙江工业大学;浙江工业大学义乌科学技术研究院有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 杭州天正专利事务所有限公司33201 代理人: 王兵,黄美娟
地址: 310014 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于深度学习的苹果采摘机器人果实目标检测方法,包括如下步骤使用移动式智能机器人搭载的相机拍摄足够多的苹果树及其果实图像,训练不同尺度的分类器,通过滑动窗口对待捡图像进行滑动检测,确定疑是存在果实窗口,并将该窗口输入卷积神经网络进行果实检测。
搜索关键词: 一种 基于 深度 学习 苹果 采摘 机器人 果实 目标 检测 方法
【主权项】:
一种基于深度学习的苹果采摘机器人果实目标检测方法,包括如下步骤:步骤1.样本数据采集:在苹果收获季节前往苹果种植园,使用移动式智能机器人搭载的相机,选取尽可能多的角度,分别拍摄顺光、逆光条件下的果树果实图片;将图片中的苹果果实部分裁剪为统一大小的正样本,不含苹果果实的部分裁剪为统一大小的负样本,正样本数与负样本数均至少为5000;步骤2.提取融合特征:使用matlab中image函数提取RGB或LUV色彩分量,通过梯度方向直方图提取检测目标的边缘梯度信息,提取方式如下:将图像I划分成若干个块状结构BLOCK,然后对每一个划分的BLOCK按照“田字格”规则均分成四个子块CELL,并统计每个CELL所属区域内像素点的梯度在不同方向上的分布得到了CELL的特征,最后将分别属于四个CELL的特征组合在一起形成了BLOCK的特征向量;设(x,y)为任意一个CELL中的像素点坐标,则其水平方向的梯度为Gx(x,y),垂直方向的梯度为Gy(x,y),梯度幅值为G(x,y),以及梯度的方向为θ(x,y),分别由公式(1)、(2)、(3)、(4)计算得出:Gx(x,y)=I(x+1,y)‑I(x‑1,y)  (1)Gy(x,y)=I(x,y+1)‑I(x,y‑1)  (2)G(x,y)=(Gx(x,y))2-(Gy(x,y))2---(3)]]>θ(i,j)=arctan(Gy(x,y)Gx(x,y))---(4)]]>在CELL中的所有像素点都按照上述公式计算完毕之后,该CELL就可以用一个基于方向的直方图来表示;该直方图的横坐标表示的是梯度方向,纵坐标表示的是对应幅值的累加和;随机选择一种通道,再使用一个大小随机、最小为25像素的矩形区域使用积分图进行像素值求和;每一张图像可以得到约5000个通道特征,这些特征构成一个特征集合,用于训练弱分类器的特征将随机从这些特征集合中选取;步骤3.分类器训练:使用步骤2中的特征集合训练adaboost分类器,其算法过程如下:(S1)初始化样本权重,w=1/N,设置最大误检率fmax,最小检测率dmin;(S2)计算弱分类器的错误率,选取合适的阈值,使得误差最小;(S3)根据上述结果,更新样本权重;权重更新如公式(5)所示,其中i为样本编号,wi为样本对应的原权重,ci为上一次分类结果,yi为原始类别标签:w=wi*exp(‑yi*ci)  (5)(S4)将迭代产生的t个弱分类器线性组合成一个状态分类器,如公式(6)所示,H(x)为组合分类器的输出;H(x)=1Σk=1tαkhk(x)≥12Σk=1tαk0other---(6)]]>其中hk(x)为弱分类器的输出,α表示h(x)在最终分类器中的重要程度,error表示错误率;(S5)对每个正样本计算H(x),统计其分类结果,计算分类器的检测率;若该检测率低于预先设定的目标检测率,则降低该分类器的阈值,提高检测率;步骤4.滑动窗口检测:用滑动窗口在整幅图像上以一定的步长滑动,直到遍历完整幅图像,遍历过程中将窗口放入步骤3中训练完成的分类器中进行分类,若判定该窗口为苹果果实,则将该窗口标定出来作为疑是存在果实窗口,否则继续滑动;某个尺度的滑动窗口滑动完毕后,下一个尺度的滑动窗口将继续上一步的步骤,直到所有尺度的分类器滑动完成;步骤5.卷积神经网络检测:构建卷积神经网络模型,将步骤4确定的疑是存在果实窗口输出至该模型进行果实检测;其中卷积神经网络模型相关描述如下:卷积神经网络模型依次由输入层、卷积层、池化层、卷积层、池化层、输出层组成;疑是果实存在窗口图像作为输入层,卷积层C层为特征提取层,池化层S层位于卷积层后,是一个二次提取的计算层;第二个S层,即完成了对原始数据的特征提取后,把S层的特征数据进行向量化,然后连接到分类器,经输出层输出类别结果;卷积层用卷积核(一个特征矩阵)在图像矩阵上游走,在对应位置元素相乘,再把相乘的结果相加,最后相加的结果形成新的图像矩阵,游走完成后即完成了对原始图像的卷积变换,形成此卷积核下的特征提取;在通过卷积获得了特征之后,对特征矩阵分区域进行平均值池化,降低特征维度;输出层输出实际类别,与样本的类别标签对比,反向调整权值,直至实际输出与类别标签尽可能接近,调整迭代次数直至误差函数收敛;卷积神经网络的训练过程包含前向传播与反向传播两个过程;前向传播将上一层的输出加权求和后,经由激活函数输出结果,该结果又作为下一层的输入,继续加权求和,由激活函数输出,如此反复,直到网络模型最后的输出层;l层为当前层,当前层的输出结果为a(l),W表示权值,b表示偏置,下一层则为l+1层,l层的输出结果a(l)作为l+1层的输入结果,z(l+1)为l层输出结果的加权和,经由激活函数计算得到l+1层输出结果a(l+1),激活函数f(z)=1/(1+e‑z)为sigmod函数;计算公式如公式(7)、公式(8)所示:z(l+1)=W(l)a(l)+b(l)  (7)a(l+1)=f(z(l+1))  (8)接下来,通过反向传播调整网络模型的权值W和偏置b;反向传播的核心是使代价函数J(W,b)最小化,从而使得误差更小;具体计算过程如下:(T1)公式(9)为代价函数计算公式:J(W,b;x,y)=12||hW,b(x)-y||2---(9)]]>其中hW,b(x)为前向传播最终输出的实际结果,y为对应的样本标签,即期望输出;(T2)对于第nl层(输出层)的每个输出单元i,根据公式(10)计算其残差δ(nl)=-(y-anl)·f′(z(nl))---(10)]]>(T3)对l层(中间层)的第i个节点的残差δ(l)计算公式为式(11):δ(l)=((W(l))Tδ(l+1))·f'(z(l))  (11)(T4)分别计算J(W,b)的偏导数▽W(l)J(W,b;x,y)和▽b(l)J(W,b;x,y),计算公式为式(12):▽W(l)J(W,b;x,y)=δ(l+1)(a(l))T,▽b(l)J(W,b;x,y)=δ(l+1)  (12)(T5)更新权值参数W(l)和偏置参数b(l)如式(13):ΔW(l):=ΔW(l)+▿W(l)J(W,b;x,y)Δb(l):=Δb(l)+▿b(l)J(W,b;x,y)W(l)=W(l)-α[(1mΔW(l))+λW(l)]b(l)=b(l)-α[(1mΔb(l))]---(13)]]>接着重复以上迭代步骤,不断更新权值与偏置,减小J(W,b)的值,进而得出完整的卷积神经网络;步骤6.实际检测:使用移动式智能机器人搭载的相机前往果园拍摄苹果果树画面,经由步骤2至步骤5中训练完成的卷积神经网络模型检测后,机器人视觉系统锁定检测到的果实目标,再经由控制系统控制机械手臂,采摘果实。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学;浙江工业大学义乌科学技术研究院有限公司,未经浙江工业大学;浙江工业大学义乌科学技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710665266.1/,转载请声明来源钻瓜专利网。

同类专利
  • 用于自动驾驶的弯道识别方法-201810408110.X
  • 孙毅 - 孙毅
  • 2018-05-02 - 2019-11-12 - G06K9/00
  • 本发明公开了用于自动驾驶的弯道识别方法,包括以下步骤:S1:将采集到的路面的原始图片灰度化成为灰度图;S2:将灰度图二值化形成二值化图;S3:以色相、亮度和饱和度为维度建立三维色彩空间;S4:将原始图片映射到三维色彩空间;S5:将二值化图和映射到三维色彩空间的图片混合,并制作直方图;S6:选出直方图中的峰值作为道路边界。本发明用于自动驾驶的弯道识别方法,通过上述步骤,即可实现对道路上白色和黄色分界线的识别,提高了自动驾驶的安全性。
  • 基于高斯噪声过滤的分辨系统-201810408141.5
  • 孙毅 - 孙毅
  • 2018-05-02 - 2019-11-12 - G06K9/00
  • 本发明公开了基于高斯噪声过滤的分辨系统,包括:用于将采集到的路面的原始图片灰度化成为灰度图的灰度模块;用于将灰度图二值化形成二值化图的二值化模块;用于以色相、亮度和饱和度为维度建立三维色彩空间的维度模块;用于将原始图片映射到三维色彩空间的映射模块;用于将二值化图和映射到三维色彩空间的图片混合,并制作直方图的直方模块;用于选出直方图中的峰值作为道路边界的选取模块。本发明基于高斯噪声过滤的分辨系统,通过上述模块,即可实现对道路上白色和黄色分界线的识别,提高了自动驾驶的安全性。
  • 用于云平台身份识别的可切换滤镜摄像头的应用方法-201810411094.X
  • 宫雅卓 - 上海聚虹光电科技有限公司
  • 2018-05-02 - 2019-11-12 - G06K9/00
  • 本发明公开了一种用于云平台身份识别的可切换滤镜摄像头的应用方法,所述可切换滤镜摄像头包括滤镜切换装置和摄像头,所述滤镜切换装置可以切换选择红外带通滤镜和红外截止滤镜;所述方法包括步骤:设置滤镜切换装置处于红外截止滤镜状态,摄像头采集第一图像;滤镜切换装置切换为红外带通滤镜状态,摄像头采集第二图像,第二图像采集完成后继续采集多帧红外图像;对第一图像和第二图像进行人脸活体检测;若人脸活体检测通过,则将第一图像上传到服务器进行云端人脸识别,同时在本地对S2所述的第二图像与多帧红外图像进行质量评估,通过质量评估得到质量最高的红外图像,上传所述质量最高的红外图像到服务器,进行云端虹膜识别。
  • 身份验证系统、方法、装置和计算机可读存储介质-201810416995.8
  • 潘晖;胡馨文 - 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
  • 2018-05-04 - 2019-11-12 - G06K9/00
  • 本公开涉及一种身份验证系统、方法、装置和计算机可读存储介质,涉及信息处理技术领域。该系统包括:图像传感器,被配置为获取用户的人脸图像;设备信息获取装置,被配置为获取用户的移动设备信息;和处理器,被配置为:对人脸图像进行人脸识别,以获取用户的人脸特征;计算获取的人脸特征与用户预留的人脸特征的匹配程度;根据匹配程度,判断是否需要获取用户的移动设备信息来验证用户;在不需要的情况下,根据匹配程度确定是否通过用户的身份验证;在需要的情况下,根据获取的移动设备信息与用户预留的移动设备信息是否一致,确定是否通过用户的身份验证。本公开的技术方案能够提高身份验证的准确率和用户体验。
  • 指纹成像模组和电子设备、电子设备的修复方法-201810424354.7
  • 曲志刚;朱虹 - 上海箩箕技术有限公司
  • 2018-05-04 - 2019-11-12 - G06K9/00
  • 一种指纹成像模组和电子设备、电子设备的修复方法,指纹成像模组包括:保护盖板;指纹成像组件,指纹成像组件通过连接层贴合于保护盖板上;连接层的材料包含形状记忆聚合物。通过在连接层内添加形状记忆聚合物,从而在指纹成像模组经历骤冷或者骤热一类的极限条件,连接层出现形变,连接层与保护盖板之间出现空隙时,通过一定的刺激处理,能够使连接层恢复至初始形状,以保证指纹成像组件和保护盖板之间的间隔距离,使连接层填充满保护盖板和指纹成像组件之间间隔,从而能够保证指纹成像模组光路的恢复,能够实现指纹成像模组的修复,有利于提高经历极限条件后高质量指纹图像的获得。
  • 智能化婴儿监控平台-201910220482.4
  • 李娟娟 - 李娟娟
  • 2019-03-22 - 2019-11-12 - G06K9/00
  • 本发明涉及一种智能化婴儿监控平台,包括:自动冲奶机构,包括水箱、奶粉罐、冲奶驱动设备、冲奶执行设备和奶水瓶;在自动冲奶机构中,冲奶执行设备包括搅拌器、第一吸料口、第二吸料口和第一出料口;第一吸料口埋入水箱内,第二吸料口埋入奶粉罐内,第一出料口位于奶水瓶的上方;冲奶驱动设备用于在确定对应的婴儿目标处于哭啼状态时,控制冲奶执行设备进行冲奶动作。本发明的智能化婴儿监控平台设计精巧,方便使用。由于引入定制结构的自动冲奶机构,用于在基于神经网络模式的识别机构确定当前房间内存在哭啼婴儿目标时,自动触发自动冲奶机构执行自动冲奶动作,从而提升了冲奶效率,减少了婴儿等待的时间。
  • 一种应用于超声波局放检测的数据滤波方法-201910249006.5
  • 申浩;孔亚广;陈张平 - 杭州电子科技大学
  • 2019-03-29 - 2019-11-12 - G06K9/00
  • 本发明公开了一种应用于超声波局放检测的数据滤波方法,本发明针对超声波局放检测中可能存在的脉冲干扰,采用中值滤波器,一种基于次序统计完成信号恢复的一种非典型的非线性滤波器。一维情况下,其本质是一个有一定长度的滑动窗口,窗口中心位置的信号由窗口内各值排序后的中值代替。当脉冲宽度小于窗口宽度一半时,中值滤波对窄脉冲干扰是非常有效的。然后针对随机噪声的处理,在对比小波包阈值函数去噪和奇异值分解算法后,提出了基于奇异值能量差分谱的奇异值分解滤波算法。在此算法中定义的奇异值能量差分谱能够很好的确定重构矩阵的阶数,从而把随机噪声贡献的奇异值和局放信号贡献的奇异值区分开来,从而达到很好的滤波效果。
  • 单像素传感器-201910358001.6
  • M·泽基尼;P·奥素立凡;王超 - 美国亚德诺半导体公司
  • 2019-04-30 - 2019-11-12 - G06K9/00
  • 本公开涉及使用单像素传感器执行面部识别,该单像素传感器测量从受试者面部反射的光脉冲的时间特征。由于传感器位置与受试者的面部的不同部分之间的深度差异,来自受试者的面部的不同部分的短持续时间照射脉冲的反射将在不同时间返回传感器,从而提供时间基于个人受试者独有的一维签名。通过使用神经网络或主成分分析(PCA)分析反射签名,可以获得受试者的识别。另外,除了面部之外,相同的系统还可以用于识别或区分已知形状的任何其他对象,例如生产线上的制造产品等。
  • 用于对象检测的图像处理-201910367785.9
  • 阿列克谢·洛皮奇;安东·卡恰图 - 顶级公司
  • 2019-05-05 - 2019-11-12 - G06K9/00
  • 本公开涉及用于对象检测的图像处理。一种包括对象检测系统的计算设备中的图像处理的方法包括:处理第一图像帧、第二图像帧和一个或多个另外的图像帧,已继所述第一图像帧之后捕获所述第二图像帧并且已继所述第二图像帧之后捕获所述一个或多个另外的图像帧。对所述第一图像帧和所述第二图像帧执行特征提取操作。使用来自所述特征提取操作的特征数据来执行对象检测操作,以产生对象检测数据。响应于所述对象检测数据的特性而修改用于处理所述一个或多个另外的图像帧的所述特征提取操作的至少一个参数。
  • 用于管理音视频、音频或视频内容的方法和装置-201910383640.8
  • 乔纳森·迪金斯 - 草谷有限公司
  • 2015-02-15 - 2019-11-12 - G06K9/00
  • 本发明涉及用于管理音视频、音频或视频内容的方法和装置。为了管理音视频内容,在指纹生成器中推导指纹流并且在与指纹生成器物理上分离的指纹处理器处接收指纹流。通过以下过程来生成元数据:处理指纹以检测音频指纹的低值的持续出现,从而生成指示无声的元数据;比较时间上相继的指纹值之间的差异模式与电影节奏的预期模式以生成指示电影节奏的元数据;以及比较时间上相继的指纹值之间的差异与阈值以生成指示静止图像或停帧的元数据。
  • 异常行为监控处理方法、装置、计算机设备和存储介质-201910502623.1
  • 杨谦;陈实 - 万翼科技有限公司
  • 2019-06-11 - 2019-11-12 - G06K9/00
  • 本申请涉及一种异常行为监控处理方法,该方法包括:获取多个监控设备采集的视频数据,检测多个视频数据中访问人员的人脸图像,从多个视频数据中提取多帧包括人脸图像的图像数据,并生成访问人员对应的轨迹图像集合;通过行为分析模型计算轨迹图像集合的行为轨迹特征,根据多项异常检测指标分析行为轨迹特征的异常类型和异常值并生成行为分析结果;当行为分析结果中存在异常行为时,获取存在异常行为的人脸图像,并根据人脸图像以及对应的位置标识和时间标识生成安防预警任务;将安防预警任务分配至安防终端,使得对应的安保人员根据安防终端执行安防预警任务。采用本方法能够准确有效地识别访问人员的异常行为以提高园区的异常监控效率。
  • 自动驾驶目标识别方法-201910511368.7
  • 唐竞;林长波;罗文;熊禹;吴祖亮;冼伯明;周翔 - 东风柳州汽车有限公司
  • 2019-06-13 - 2019-11-12 - G06K9/00
  • 本发明公开了一种自动驾驶目标识别方法,属汽车制造技术领域,该方法采用装在车辆上的双目摄像头,以及接收和处理双目摄像头信息的处理器;其目标识别的方法是:首先,处理器将双目摄像头针对同一目标输入的各单个图像信息经过NSCT变换分解后的低频子带系数和高频子带系数进行融合,获得低频融合子带系数和高频融合子带系数,再通过逆NSCT变换得到融合图像;然后采用Gabor算法对融合图像进行局部特征的提取,并将提取的局部特征信息输入至通过监督自学习的运算训练完成的神经网络中,然后分类输出给执行器。本发明可以解决现有自动驾驶目标识别存在的对车辆周边目标物进行识别的分辨率低、识别能力有限的问题。
  • 一种沃柑病变的自动识别方法-201910514833.2
  • 孙青霭;黄琨;梁业生;黄朝庆 - 广西农业职业技术学院
  • 2019-06-14 - 2019-11-12 - G06K9/00
  • 本发明公开了一种沃柑病变的自动识别方法,涉及果树生长监测技术领域。所述自动识别方法,通过采集不同生长周期内的实时生长图像,并提取实时生长图像的特征像素点数据,以生长周期和特征像素点数据进行沃柑病变的自动识别,无需人工监测,通过该自动识别方法及系统能够及时掌握沃柑的生长状态及病变状态,以便种植人员及时处理,降低了沃柑大面积病变的概率,提高了沃柑的质量和产量;本发明构建人工神经网络构建病变识别模型对沃柑病变进行自动识别,提高了沃柑病变的自动识别能力,进而提高了病变的识别精确度。
  • 人脸识别方法、装置、计算机设备及可读存储介质-201910533013.8
  • 张磊;王俊强;李方君 - 平安科技(深圳)有限公司
  • 2019-06-19 - 2019-11-12 - G06K9/00
  • 本发明提供了一种人脸识别方法、装置、计算机设备及可读存储介质,其中方法包括:获取待识别视频并进行视频解码,得到组成待识别视频的所有视频帧,所有视频帧按照播放顺序排成播放队列;根据指令在播放队列中选定第一视频帧进行人脸检测,并统计第一视频帧对应的检测耗时;根据检测耗时从播放队列中间隔选取特定排序的视频帧并进行人脸检测。在对视频进行人脸检测时,根据对当前帧的检测耗时确定开始下一次检测前能够丢弃的最大帧数,然后在最大帧数范围内丢弃一定数量视频帧,使视频播放与人脸检测能够同步显示,减少延时现象的发生,提高人脸检测时视频播放的流畅度。
  • 一种人脸识别方法及设备-201910555801.7
  • 林嘉华;刘军;周凯 - 深圳英飞拓科技股份有限公司
  • 2019-06-25 - 2019-11-12 - G06K9/00
  • 本发明适用于计算机技术领域,提供了一种人脸识别方法及设备,包括:获取待识别用户的目标人脸的目标人脸信息;所述目标人脸信息包括目标人脸属性信息和目标人脸特征信息;基于所述目标人脸属性信息、预设人脸数据库以及预设查找策略,确定所述目标人脸对应的人脸子数据库;基于所述目标人脸特征信息遍历所述人脸子数据库,当第一人脸的人脸特征信息与所述目标人脸特征信息之间的相似度值满足预设条件时,将所述第一人脸对应的身份信息识别为所述待识别用户的身份信息。上述方案,基于人脸属性信息将人脸识别数据库进行细分,直接在子库中识别出目标人脸,大大的提高搜索性能,缩小了查询范围,减少了工作量,提升了识别速度。
  • 一种电力设备巡检机器人图影像采集处理系统及方法-201910562522.3
  • 李煜煌;何程;金伟;孙潍 - 云南兆讯科技有限责任公司
  • 2019-06-26 - 2019-11-12 - G06K9/00
  • 本发明涉及一种电力设备巡检机器人图影像采集处理系统及方法,属于电力设备巡检机器人技术领域。该系统包括安装在电力设备巡检机器人上的拍摄设备、拍摄控制模块、视觉特征识别模块、3D建模模块、景深计算模块和图像优化模块;拍摄设备分别与拍摄控制模块、视觉特征识别模块相连;视觉特征识别模块、3D建模模块、景深计算模块和图像优化模块顺序连接;本系统可以实现一次运行采集多个设备图像和/或影像数据的功能,从而大大缩短电力设备机器人巡检的时间,提高巡检效率;同时,由于本系统拍摄位置精度要求低于传统拍摄技术,能够显著降低变电站等电力生产环境为巡检机器人能够运行而进行改造施工的技术难度,降低改造成本。
  • 一种基于判别森林子空间选择的高光谱异常探测方法-201910565596.2
  • 杜博;常世桢;张良培 - 武汉大学
  • 2019-06-27 - 2019-11-12 - G06K9/00
  • 本发明提供一种基于判别森林子空间选择的高光谱异常探测方法,包括以从高光谱图像中随机选择部分像元,构造一棵子空间选择孤立二叉树,按此构造孤立判别森林;将高光谱图像遍历所构造的孤立判别森林,计算平均路径长度;计算每个像素的异常分数值,实现探测异常目标。本发明利用孤立判别森林模型以子集合的形式重复学习和估计图像中背景类和异常类的分布规律,在此基础上引入轴平行子空间选择方法,选择对异常信息判别更加有利的波段,避免因波段冗余和维度过高而造成的异常信息被埋没的问题,求解影像的异常分数值信息,获得高光谱图像异常目标探测的最终结果。
  • 结合残差卷积结构和循环神经网络的乐谱图像识别方法-201910571835.5
  • 吴琼;李锵;关欣 - 天津大学
  • 2019-06-28 - 2019-11-12 - G06K9/00
  • 本发明涉及一种基于残差结构卷积神经网络和循环神经网络的乐谱图像识别方法,包括:1)建立乐谱图像的数据集;2)构建模型:将残差结构卷积神经网络和循环神经网络结合,构建深度学习网络模型,设置模型结构参数;3)训练模型:利用数据集对构建好的深度学习网络模型进行训练,深度学习网络模型输入为数据集中乐谱图像,真值标签为乐谱图像中各音符对应的语义信息,通过链式时序分类损失函数逐步调整网络各参数并达到最优,最终输出音符语义信息的预测值。
  • 基于深度学习的中文唇语识别方法-201910582188.8
  • 林旭东;徐俊华;王威 - 厦门知晓物联技术服务有限公司
  • 2019-06-30 - 2019-11-12 - G06K9/00
  • 本发明公开了一种基于深度学习的中文唇语识别方法,所述方法包括如下步骤:S1、获取到唇部序列图像;S2、从获取到的唇部序列图像,提取出唇部序列图像的特征;S3、将该提取出的唇部序列图像的特征输入到双向长短时记忆网络进行时间空间特征序列学习,并将该经学习后的唇部序列图像的特征进行训练,训练该经学习后的唇部序列图像的特征到唇语的识别模型;S4、根据该训练该经学习后的唇部序列图像的特征到唇语的识别模型,对该提取出的唇部序列图像的特征进行解码识别,识别出唇语结果。本发明对嘴部的定位准确性高,计算方法得到简化,采用双向LSTM网络更好解决信息衰退。
  • 基于视频识别的客流潮汐分析方法、系统及存储介质-201910587669.8
  • 沈辉 - 合肥非度信息技术有限公司
  • 2019-07-02 - 2019-11-12 - G06K9/00
  • 本发明实施方式提供一种基于视频分析的客流潮汐分析方法、系统及存储介质,属于智能管理技术领域。所述客流潮汐分析方法包括:采集现场的客流量密度;判断所述客流量密度是否大于或等于预设的第一阈值;在判断所述客流量密度大于或等于所述第一阈值的情况下,向主控中心发送限流请求。本发明提供的基于视频识别的客流潮汐分析系统通过对现场的图像进行分析,计算出现场的客流量密度,并进一步根据该客流量密度判断现场是否需要作限流处理,使得视频监控在完成供工作人员查看现场的同时,还能够智能识别出现场的客流量状态。
  • 一种基于深度学习的人脸检测及面部多属性融合分析方法-201910590960.0
  • 张赛男;李千目 - 南京理工大学
  • 2019-07-02 - 2019-11-12 - G06K9/00
  • 本发明公开了一种基于深度学习的人脸检测及面部多属性的融合分析方法。该方法为:首先输入图像,利用图像金字塔生成该图片的不同尺度集合,采用全卷积神经网络对输入的图像进行处理,第一层级网络产生初步的人脸候选区域;然后人脸检测模块由粗到细筛选出人脸候选框,利用非极大值抑制算法将重复面积超出设定阈值的候选窗口进行精简,确定人脸区域;接着将人脸区域放大,传送至面部属性分析网络进行分析,得到年龄、性别预测结果;最后将人脸检测结果和属性分析结果标注在图片上并进行保存,得到可视化的预测结果。本发明降低了人脸检测及面部多属性融合分析的复杂度,具有结构简单、参数少、实用性强的优点。
  • 基于改进稀疏表示的人脸人耳特征融合识别算法-201910592320.3
  • 郑秋梅;王璐璐;马茂东 - 中国石油大学(华东)
  • 2019-07-03 - 2019-11-12 - G06K9/00
  • 本发明提出基于改进稀疏表示的人脸人耳特征融合识别算法(P‑SRC),打破单一生物特征在识别过程中的局限性,属于计算机研究技术领域。其包括以下步骤:(1)采用能有效降低计算复杂度的PCA提取算法对人脸人耳融合特征进行提取;(2)采用加权串联融合法对人脸人耳特征进行特征融合;(3)采用迭代速度比较快的正交匹配追踪算法对测试样本在训练样本中稀疏表示系数进行求解;(4)采用最小残差法进行分类识别。经实验验证本发明能够有效降低计算复杂度和提高识别准确率。
  • 一种智能机器人-201910596741.3
  • 施超灵 - 启东威艾信息技术有限公司
  • 2019-07-02 - 2019-11-12 - G06K9/00
  • 本发明公开了一种智能机器人,包括输入模块、语音系统、图像系统、数据库处理系统、输出模块、显示屏和供电模块,所述输入模块的输出端分别与语音系统、图像系统的输入端进行连接,所述语音系统、图像系统的输出端与数据库处理系统的输入端相连接,所述数据库处理系统的输出端与显示屏、输出模块的输入端相连接,所述显示屏、输出模块分别与供电单元进行连接。本发明的图像系统用于对周围场景进行处理,得到三维场景,语音系统用于对用户发出的语音进行采集和识别,得到语音指令,数据库处理系统用于存储现实场景并根据语音指令对三维场景进行调用,显示屏用于显示调用的三维场景,从而实现了用户语音识别和环境场景获取。
  • 一种全智能电脑显示屏防手机偷拍系统-201910597374.9
  • 彭雯;崔朗福 - 北京九天翱翔科技有限公司
  • 2019-07-04 - 2019-11-12 - G06K9/00
  • 本发明涉及一种全智能电脑显示屏防手机偷拍系统及方法,主要包含视频监控采样模块,主服务器,报警锁屏模块。在视频监控采样模块中,微型摄像头实时监控电脑显示屏前操作人员的工作状态,实时采样获取视频图像存储到视频存储并输出;在主服务器中,图像处理模块接收实时视频图像并进行图像处理,手机检测模块接收图像处理的结果并进行手机检测,手机识别模块接收手机检测的结果进行手机形状识别,输出监控识别状态;判据库中存放手机形状,手机形状根据视频存储中的手机图像学习训练得到;在报警锁屏模块中,报警模块接收监控识别状态,若监控识别状态为有手机,报警模块发送报警信号;锁屏模块接收报警信号,对操作系统进行锁屏处理。
  • 数据集处理方法、数据集处理装置及存储介质-201910608507.8
  • 贺涛;欧阳一村 - 深圳中兴网信科技有限公司
  • 2019-07-08 - 2019-11-12 - G06K9/00
  • 本发明提供了一种数据集处理方法、数据集处理装置及存储介质,其中,数据集处理方法包括:多个不同种类的标注框对目标图像数据的不同区域进行标注得到的第一数据集,并对第一数据集进行训练得到状态检测模型;对状态检测模型的检测精度进行测试,利用状态检测模型对待标注目标图像数据进行检测得到图像信息;通过图像信息对待标注目标图像数据进行标注得到第二数据集;将第一数据集和第二数据集合并保存作为待训练数据集,并对待训练数据集进行训练得到新的状态检测模型。该技术方案不需要纯手动的标注数据集,降低了人工成本,提高了状态检测模型的迭代优化的效率,并且标注数据集更精确,提升了检测模型的准确率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top