[发明专利]目标检测模型训练、检测方法、装置、设备及存储介质在审
申请号: | 202010846386.3 | 申请日: | 2020-08-21 |
公开(公告)号: | CN111738262A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 康凯;李兵;秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 高彦;李丽 |
地址: | 100043 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 模型 训练 方法 装置 设备 存储 介质 | ||
本申请的目标检测模型训练、检测方法、装置、设备及存储介质,其中,在训练目标检测模型的过程中,目标检测模型执行处理训练样本数据集中的待检测图像,得到待检测图像中每个像素位置对应的候选预测边界框;计算每个像素位置的候选预测边界框与至少一个真实边界框之间的交并比,以从中获得目标交并比作为相应像素位置的置信得分,获得对应所述待检测图像的置信得分图;根据所述置信得分图对标记目标所在区域的各个候选预测边界框执行合并操作,以获得目标检测结果。本申请技术方案中改进的置信得分图,其中置信得分含义与合并操作中实质认为的意义一致,利用训练得到的目标检测模型进行目标检测,可以提升目标检测结果的准确性。
技术领域
本申请实施例涉及图像处理技术领域,尤其涉及一种目标检测模型训练、检测方法、装置、设备及存储介质。
背景技术
随着计算机视觉的发展,越来越多的优秀算法被提出来解决各种现实问题。场景文本检测作为计算机视觉的基础性任务之一,已经得到了广泛的研究,并取得了越来越好的性能。因此,基于精确文本定位和识别的场景文本检测算法在现实世界中有许多重要的应用,如文档分析、自动驾驶和车牌识别等。
在众多文本检测算法中,基于回归方法的EAST模型是一种使用频率较高的高效、准确的场景文本检测器,可以直接从完整的图像中预测文本实例的存在及其几何特征。其输出具有两个分支,第一个分支是像素值在[0,1]范围内的置信得分图(score map),其值表示每个像素是否属于文本区域的概率;第二个分支是回归分支,它可以为文本区域生成两种几何图形的候选预测边界框:旋转框(RBOX)或四边形框(QUAD)。在得到score map和RBOX后,后处理算法对每个像素进行阈值化处理,得到得分超过预定置信阈值的文本区域。然后,这些区域被认为是有效的,每个像素位置会预测一个文本框,后续通过局部感知非极大抑制(LNMS)算法将同一片文本区域的像素点预测的所有候选预测边界框组合成一个最终的预测边界框用来表示该片文本区域。最后,将LNMS后的结果作为整个文本检测算法的最终输出。该算法的结构简单,最终效果较好,因此近几年来被广泛应用在文本检测场景。
然而,该算法在理论上存在缺陷。score map原本的定义为对应像素位置上的像素属于文本区域的置信度,得分越高,该位置的像素就有越大的概率属于文本区域。但在LNMS步骤中,每个score却被当作对应的回归的文本边界框的置信度。这两种定义是不等价的,因此可能会有一些置信度较高的像素点,但其对应的文本边界框的质量较差,这些文本边界框对最终输出的影响更大。例如一个长条形状的文本行,其中心点区域的位置的score得分无疑会非常高(理论上越靠近文本中心区域的位置,其score越高),但是由于网络感受野的限制或其他种种原因,中心区域的位置很难捕获到文本边界框边缘位置的信息,因此通常这些位置预测出的文本边界框的边缘误差会比较大,导致最终合成的边界框的边缘回归效果较差。
此外,EAST模型对于较宽或较长文本区域的检测能力较弱,导致边缘回归效果较差,这是因为EAST模型的感受野较小所造成。
因此,如何找到一种能兼顾已有文本检测模型如EAST的的优点,又能克服所存在的缺点,已成为亟待解决的技术问题。
发明内容
有鉴于此,本申请实施例中提供目标检测模型训练、检测方法、装置、设备及存储介质,解决现有技术中的技术问题。
本申请实施例提供了一种目标检测模型的训练方法,包括:
获取训练样本数据集;其中,所述训练样本数据集包括:带有真实边界框的待检测图像;
将所述训练样本数据集输入目标检测模型以对其训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010846386.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:MEMS麦克风的制造方法
- 下一篇:一种基于平行仿真的虚拟舞台