[发明专利]一种文本定位方法及电子设备在审
申请号: | 202210466576.1 | 申请日: | 2022-04-29 |
公开(公告)号: | CN115082932A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 高磊;周健;燕鹏举;张泉 | 申请(专利权)人: | 上海弘玑信息技术有限公司 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/19 |
代理公司: | 江苏瑞途律师事务所 32346 | 代理人: | 李维朝;计璐 |
地址: | 200000 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 定位 方法 电子设备 | ||
本发明公开一种文本定位方法及电子设备,针对现有技术中在机器人流程自动化软件无法正常捕获信息的不足,本发明接收目标图像和目标字符串;定位所述目标图像内原始文本元素的位置,识别所述原始文本元素中的可识别字符串;根据所述目标字符串和所述原始文本元素中的可识别字符串,从所述原始文本元素中筛选出目标文本元素;计算所述目标文本元素字符串与所述目标字符串之间的字符串相似度,获取相似度最高的目标文本元素;确定相似度最高目标文本元素的最小外接矩形框,实现文本定位。本发明能够根据目标字符串自动查找该字符串在输入图像中的位置,提高元素抓取的性能并且减少工作人员工作量,有效提高工作人员的工作效率。
技术领域
本发明涉及计算机视觉技术领域,更具体地说,涉及一种文本定位方法及电子设备。
背景技术
机器人流程自动化(Robotic process automation,简称RPA)是以软件机器人及人工智能(AI)为基础的业务过程自动化科技。机器人流程自动化是一种新型过程流程自动化办公室机器人软件,它通过模仿最终用户在电脑的手动操作方式,进行自动流程执行处理,使最终用户手动操作流程自动化。将办公人员从每日的重复工作中解放出来,提高生产效率。
捕获是机器人流程自动化应用过程中常用的工具,当工作人员使用机器人流程自动化软件进行捕获时,一般是通过接口等获取当前操作页面整体的框架结构及元素分布,进而选取特点元素的传统捕获方式获取屏幕中需要进行操作的位置,但是传统捕获存在以下的缺点:如果元素的排版发生变化,则有可能无法定位到元素,在实际应用中体现为上次捕获可以正常获取的元素,再次捕获时因为元素的排版变化提示报错;同时,传统方法也无法处理需要根据外部输入字符串来定位文本元素位置的场景。
发明内容
1.要解决的技术问题
针对现有技术中存在的在机器人流程自动化软件无法正常捕获或捕获出错的问题,本发明提供一种文本定位方法及电子设备,能够根据输入的目标字符串自动查找该目标字符串在目标图像中的位置并实现捕获,准确度更高且更灵活,有效提高工作人员的工作效率。
2.技术方案
本发明的目的通过以下技术方案实现。
第一方面,本发明公开一种文本定位方法,包括:
接收目标图像和目标字符串;
定位所述目标图像内原始文本元素的位置,识别所述原始文本元素中的可识别字符串;
根据所述目标字符串和所述原始文本元素中的可识别字符串,从所述原始文本元素中筛选出目标文本元素;
计算所述目标文本元素字符串与所述目标字符串之间的字符串相似度,获取相似度最高的目标文本元素;
确定相似度最高目标文本元素的最小外接矩形框。
更进一步的,所述原始文本元素包括第一聚合文本元素和第一非聚合文本元素,其中,
在从所述原始文本元素中筛选出目标文本元素前,对相邻的原始文本元素进行聚合,形成第一聚合文本元素。
在从原始文本元素中筛选出目标文本元素前,进行聚合,对于符合相邻条件进行聚合后形成的即此处的第一聚合文本元素,对于不符合相邻条件聚合的,即此处的第一非聚合文本元素。第一聚合文本元素形成后,对第一聚合文本元素和第一非聚合文本元素进行筛选,然后再计算相似度。
更进一步的,所述目标文本元素包括第二聚合文本元素和第二非聚合文本元素,其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海弘玑信息技术有限公司,未经上海弘玑信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210466576.1/2.html,转载请声明来源钻瓜专利网。