[发明专利]目标对象关键点的检测模型训练方法、检测方法和设备有效
申请号: | 202110986015.X | 申请日: | 2021-08-26 |
公开(公告)号: | CN113436064B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 王鹏程;高原;刘霄 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 祝乐芳 |
地址: | 100089 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 对象 关键 检测 模型 训练 方法 设备 | ||
本公开涉及一种目标对象关键点的检测模型训练方法、检测方法和设备,通过获取视频样本,将视频样本中包含的多个第一待检测图像样本输入候选关键点检测网络,得到每个第一待检测图像样本分别对应的第一候选关键点,再将多个第一待检测图像样本和上一步得到的每个第一待检测图像样本分别对应的第一候选关键点输入自编码网络,得到自编码网络输入的多个目标生成图像样本,基于多个目标生成图像样本的稳定性结果更新候选关键点检测网络的参数,直到稳定性结果满足第一预设条件,则确定候选关键点检测网络为目标关键点检测网络,即,基于多个目标生成图像样本的稳定性结果作为收敛条件训练候选关键点检测网络,从而,提高目标关键点检测网络的稳定性。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种目标对象关键点的检测模型训练方法、检测方法和设备。
背景技术
随着图像处理技术的发展,美颜广泛应用于短视频拍摄、网络直播等应用软件中。例如:在网络直播的过程中,对视频中的人脸图像进行关键点(例如:鼻子、眼睛等)检测,基于检测到的关键点对人脸进行美化。
现有的关键点检测方法,通常是获取视频样本,对视频样本中的待检测图像样本的关键点进行人工标注,基于视频样本训练得到关键点检测网络,利用关键点检测网络获取待检测视频中的待检测图像的关键点。
然而,采用现有的技术方法,关键点检测的稳定性不高。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种目标对象关键点的检测模型训练方法、检测方法和设备。
第一方面,本公开提供一种目标对象关键点的检测模型训练方法,包括:
获取视频样本,所述视频样本中包括:多个包含第一目标对象的第一待检测图像样本,其中,多个所述第一待检测图像样本中包含第一目标对象未被标注关键点信息的待检测图像样本;
将多个所述第一待检测图像样本输入候选关键点检测网络,得到每个第一待检测图像样本分别对应的第一候选关键点;
将所述多个第一待检测图像样本和每个所述第一待检测图像样本对应的第一候选关键点输入目标自编码网络,得到多个目标生成图像样本;
根据所述多个目标生成图像样本的稳定性结果,更新所述候选关键点检测网络的参数,返回执行将多个所述第一待检测图像样本输入候选关键点检测网络,得到每个第一待检测图像样本分别对应的第一候选关键点;直到所述稳定性结果满足第一预设条件,确定所述候选关键点检测网络为目标关键点检测网络。
可选的,所述目标自编码网络包括:第一编码器、第二编码器和解码器;
所述将多个所述第一待检测图像样本和所述每个第一待检测图像样本对应的第一候选关键点输入目标自编码网络,得到多个目标生成图像样本,包括:
针对每个第一待检测图像样本,执行以下步骤,得到多个目标生成图像样本:
利用第一编码器对所述第一待检测图像样本对应的第一候选关键点进行第一编码处理,得到所述第一候选关键点对应的关键点特征;
利用第二编码器对所述第一待检测图像样本进行第二编码处理,得到所述第一待检测图像样本对应的图像特征;
利用所述解码器根据所述关键点特征和所述图像特征,得到所述第一待检测图像样本对应的目标生成图像样本。
可选的,所述目标自编码网络通过以下方式训练获得:
将多个包含第二目标对象的第二待检测图像样本输入第一初始关键点检测网络,得到每个所述第二待检测图像样本分别对应的第一初始关键点,其中,所述第二待检测图像样本中包含第二目标对象未被标注关键点信息的待检测图像样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110986015.X/2.html,转载请声明来源钻瓜专利网。