[发明专利]图像方向的确定方法、装置、电子设备和介质在审
申请号: | 202211732802.2 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116052181A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 范森;刘珊珊;吕鹏原;章成全;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/14 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 方向 确定 方法 装置 电子设备 介质 | ||
1.一种图像方向的确定方法,所述方法包括:
获取待识别图像,并从所述待识别图像中提取至少一个文本行区域;
将所述至少一个文本行区域旋转第一设定角度,并从旋转后的所述至少一个文本行区域中提取设定个数的第一文本行区域;
获取各所述第一文本行区域的字符识别的第一置信度;
将各所述第一文本行区域旋转第二设定角度,并获取旋转后的各所述第一文本行区域的字符识别的第二置信度;
根据各所述第一置信度和各所述第二置信度,确定所述待识别图像的方向。
2.根据权利要求1所述的方法,其中,所述根据各所述第一置信度和各所述第二置信度,确定所述待识别图像的方向,包括:
根据各所述第一置信度的均值,确定第一目标得分;
根据各所述第二置信度的均值,确定第二目标得分;
在所述第一目标得分与所述第二目标得分之间的差异大于设定差异阈值的情况下,根据所述第一目标得分和所述第二目标得分的大小关系,确定所述待识别图像的方向。
3.根据权利要求2所述的方法,其中,所述在所述第一目标得分与所述第二目标得分的差异大于设定差异阈值的情况下,根据所述第一目标得分和所述第二目标得分的大小关系,确定所述待识别图像的方向,包括:
在所述第一目标得分与所述第二目标得分的差异大于设定差异阈值的情况下,判断所述第一目标得分是否大于所述第二目标得分;
在所述第一目标得分大于所述第二目标得分的情况下,根据所述第一设定角度,确定所述待识别图像的方向;
在所述第一目标得分小于所述第二目标得分的情况下,则根据所述第一设定角度和所述第二设定角度之和,确定所述待识别图像的方向。
4.根据权利要求2所述的方法,其中,所述根据各所述第一置信度和各所述第二置信度,确定所述待识别图像的方向,还包括:
在所述第一目标得分与所述第二目标得分之间的差异小于或等于所述设定差异阈值的情况下,获取对各所述第一文本行区域进行分类得到的第一概率,其中,所述第一概率用于指示所述第一文本行区域属于设定类别的概率;
获取对旋转后的各所述第一文本行区域进行分类得到的第二概率,其中,所述第二概率用于指示旋转后的所述第一文本行区域属于所述设定类别的概率;
根据各所述第一概率和各所述第二概率,确定所述待识别图像的方向。
5.根据权利要求4所述的方法,其中,所述根据各所述第一概率和各所述第二概率,确定所述待识别图像的方向,包括:
在各所述第一概率中存在第一目标概率的情况下,根据所述第一设定角度,确定所述待识别图像的方向;其中,所述第一目标概率大于各所述第二概率;
在各所述第二概率中存在第二目标概率的情况下,根据所述第一设定角度和所述第二设定角度之和,确定所述待识别图像的方向;其中,所述第二目标概率大于各所述第一概率。
6.根据权利要求1所述的方法,其中,所述从所述待识别图像中提取至少一个文本行区域,包括:
对所述待识别图像进行特征提取,以得到图像特征;
基于所述图像特征,确定所述待识别图像中各像素点属于对应文本行的中心线的第三概率;
基于所述图像特征,确定各所述像素点与对应文本行的至少一个边界的偏移量;
根据各所述像素点对应的第三概率和偏移量,从所述待识别图像中提取所述至少一个文本行区域。
7.根据权利要求6所述的方法,其中,所述根据各像素点对应的第三概率和偏移量,从所述待识别图像中提取所述至少一个文本行区域,包括:
根据各所述像素点对应的第三概率,确定所述待识别图像中各所述文本行区域的中心线;
根据各所述文本行区域的中心线和各所述像素点的偏移量,确定至少一个文本框的位置信息;
根据所述至少一个文本框的位置信息,从所述待识别图像中提取所述至少一个所述文本行区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211732802.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序