[发明专利]文本检测方法、装置、电子设备和存储介质有效
申请号: | 202210994030.3 | 申请日: | 2022-08-18 |
公开(公告)号: | CN115393868B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 牛太阳;王佩雅 | 申请(专利权)人: | 中化现代农业有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/18;G06N3/0464;G06N3/08;G06V10/82 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 苗青盛 |
地址: | 100069 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 电子设备 存储 介质 | ||
本发明涉及计算机视觉技术领域,提供一种文本检测方法、装置、电子设备和存储介质,方法包括:将待检测图像的第一特征图输入至文本检测模型的注意力层,得到所述注意力层输出的第二特征图;将所述第二特征图输入至所述文本检测模型的文本检测层,得到所述文本检测层输出的文本检测结果;其中,所述注意力层用于对所述第一特征图的多个通道特征进行加权融合。本发明对待检测图像的第一特征图进行多通道特征提取,并将多个通道特征进行加权融合,以对不同通道的通道特征赋予不同的权重,以分别关注所需重点关注的信息,从而使得到的第二特征图更为准确,进而使基于第二特征图进行文本检测得到的文本检测结果更为准确,最终提高文本检测的准确性。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种文本检测方法、装置、电子设备和存储介质。
背景技术
文本检测是计算机视觉的重要应用领域,文件检测是进行文本识别的关键,为确保文本识别的准确性,需要确保文本检测的准确性。
目前,通过目标检测、图像分割等方法进行文本检测,然而,当前的文本检测方法并不能确保文本检测的准确性。因此,如何提高文件检测的准确性是目前亟需解决的问题。
发明内容
本发明提供一种文本检测方法、装置、电子设备和存储介质,用以解决现有技术中文本检测准确性低的缺陷,实现高准确的文本检测。
本发明提供一种文本检测方法,包括:
将待检测图像的第一特征图输入至文本检测模型的注意力层,得到所述注意力层输出的第二特征图;
将所述第二特征图输入至所述文本检测模型的文本检测层,得到所述文本检测层输出的文本检测结果;
其中,所述注意力层用于对所述第一特征图的多个通道特征进行加权融合。
根据本发明提供的一种文本检测方法,所述将待检测图像的第一特征图输入至文本检测模型的注意力层,得到所述注意力层输出的第二特征图,包括:
将所述第一特征图输入至所述注意力层的多通道特征提取层,得到所述多通道特征提取层输出的至少两个通道特征;
将所述至少两个通道特征输入至所述注意力层的特征加权层,得到所述特征加权层输出的至少两个加权特征;
将所述至少两个加权特征输入至所述注意力层的第一特征融合层,得到所述第一特征融合层输出的第二特征图。
根据本发明提供的一种文本检测方法,所述至少两个通道特征包括第一通道特征、第二通道特征、第三通道特征和第四通道特征,所述将所述至少两个通道特征输入至所述注意力层的特征加权层,得到所述特征加权层输出的至少两个加权特征,包括:
将所述第一通道特征输入至所述特征加权层的第一加权层,得到所述第一加权层输出的第一加权特征;
将所述第二通道特征输入至所述特征加权层的第二加权层,得到所述第二加权层输出的第二加权特征;
将所述第三通道特征与所述第二加权特征输入至所述特征加权层的第一加权融合层,得到所述第一加权融合层输出的第三加权特征;
将所述第四通道特征与所述第三加权特征输入至所述特征加权层的第二加权融合层,得到所述第二加权融合层输出的第四加权特征。
根据本发明提供的一种文本检测方法,所述将所述至少两个加权特征输入至所述注意力层的第一特征融合层,得到所述第一特征融合层输出的第二特征图,包括:
将所述至少两个加权特征输入至所述第一特征融合层的融合层,得到所述融合层输出的融合特征图;
将所述融合特征图输入至所述第一特征融合层的加权层,对所述融合特征图进行通道注意力加权处理和空间注意力加权处理,得到所述加权层输出的第二特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中化现代农业有限公司,未经中化现代农业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210994030.3/2.html,转载请声明来源钻瓜专利网。