[发明专利]一种图像识别的方法及装置有效
申请号: | 202111488891.6 | 申请日: | 2021-12-08 |
公开(公告)号: | CN113920512B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 王伟伟;王腾飞 | 申请(专利权)人: | 共道网络科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/146;G06V30/42;G06V30/414;G06V30/19;G06V10/774;G06K9/62;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王剑 |
地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 | ||
1.一种图像识别的方法,应用于计算机设备,其特征在于,所述方法包括:
接收用户输入的图像,检测出所述图像中的有效区域,所述有效区域包括文本区域、图像区域;
确定所述有效区域的信息类型;所述信息类型包括属性、属性值;
基于所述有效区域的位置信息和信息类型,以语义逻辑关系为划分依据,将所述有效区域划分为若干区域集合;
针对每个区域集合,基于该集合中各有效区域中的文本内容或图像,以及各有效区域的位置信息识别出所述图像携带的信息,每个区域集合对应识别出的信息包括属性信息和与其对应的属性值信息;其中,当所述属性信息为需要录入的属性信息时,与其对应的属性值信息被自动获取并录入。
2.根据权利要求1所述的方法,其特征在于,所述基于所述有效区域的位置信息和信息类型以语义逻辑关系为划分依据,将所述有效区域划分为若干区域集合,包括:
基于所述有效区域的位置信息,对各个有效区域进行编号;
根据所述有效区域的信息类型,按照编号顺序判断当前有效区域与其一阶邻居有效区域是否具有语义逻辑关系;
在当前有效区域与一阶邻居有效区域具有语义逻辑关系的情况下,将一阶邻居有效区域划分至当前有效区域所在的集合中,并将所述一阶邻居有效区域更新为新的当前有效区域;
在当前有效区域与一阶邻居有效区域不具有语义逻辑关系的情况下,确定当前有效区域所在集合划分完毕,并将所述一阶邻居有效区域更新为新的当前有效区域。
3.根据权利要求2所述的方法,其特征在于,所述基于所述有效区域的位置信息,对各个有效区域进行编号,包括:
根据各个有效区域的位置信息,按照从左到右、从上至下的顺序对各个有效区域依次进行有序编号。
4.根据权利要求2所述的方法,其特征在于,所述有效区域中的文本区域的信息类型包括属性、属性值;所述有效区域中的图像区域的信息类型是属性值;所述判断当前有效区域与其一阶邻居有效区域是否具有语义逻辑关系,包括:
若当前有效区域的信息类型是属性,且其一阶邻居有效区域的类型是属性值;确定当前有效区域与其一阶邻居有效区域具有语义逻辑关系。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
确定所述有效区域所属信息类型的行位置;
所述判断当前有效区域与其一阶邻居有效区域是否具有语义逻辑关系,还包括:
若当前有效区域的信息类型是属性,且行位置是头行,当其一阶邻居有效区域的信息类型也是属性,且行位置是非头行时,确定当前有效区域与其一阶邻居有效区域具有语义逻辑关系;
若当前有效区域的信息类型是属性,且行位置是非头行,当其一阶邻居有效区域的信息类型也是属性,且行位置是非头行时,确定当前有效区域与其一阶邻居有效区域具有语义逻辑关系;
若当前有效区域的信息类型是属性值,且行位置是头行,当其一阶邻居有效区域的信息类型也是属性值,且行位置是非头行,确定当前有效区域与其一阶邻居有效区域具有语义逻辑关系;
若当前有效区域的信息类型是属性值,且行位置是非头行,当其一阶邻居有效区域的信息类型也是属性值,且行位置是非头行,确定当前有效区域与其一阶邻居有效区域具有语义逻辑关系。
6.根据权利要求1所述的方法,其特征在于,所述基于该集合中各有效区域中的文本内容或图像,以及各有效区域的位置信息识别出所述图像携带的信息,包括:
基于行位置对相同信息类型的有效区域进行排序;
按照排序顺序,基于信息类型是属性的文本区域的文本内容识别出所述图像携带的属性;
按照排序顺序,基于信息类型是属性值的文本区域的文本内容以及图像区域的图像识别出所述图像携带的所述属性的属性值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于共道网络科技有限公司,未经共道网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111488891.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序