[发明专利]界面文本检测方法、系统及可读存储介质在审
| 申请号: | 202111531370.4 | 申请日: | 2021-12-15 |
| 公开(公告)号: | CN114399777A | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 王爽;张凌彬;何雯青;张强;郭申 | 申请(专利权)人: | 珠海金山数字网络科技有限公司;广州西山居网络科技有限公司 |
| 主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/18;G06F9/451 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 俞梁清 |
| 地址: | 519080 广东省珠海市高新区唐家湾镇前岛环路325号102室*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 界面 文本 检测 方法 系统 可读 存储 介质 | ||
1.一种界面文本检测方法,其特征在于,包括以下步骤:
对界面进行图像采集,得到图片;
对所述图片执行第一识别,得到文本;
对所述文本执行第二识别,得到文本语种。
2.根据权利要求1所述的界面文本检测方法,其特征在于,所述对界面进行图像采集包括:调用界面控件搜索接口遍历界面模块的界面树,对所述界面树的节点对应的界面进行图像采集。
3.根据权利要求2所述的界面文本检测方法,其特征在于,所述通过调用界面控件搜索接口遍历界面模块的界面树包括:
获取重复值高于阈值的界面模块,并记录所述界面模块的标识;
根据所述标识,通过所述界面控件搜索接口遍历相应的界面树。
4.根据权利要求3所述的界面文本检测方法,其特征在于,所述获取重复值高于阈值的界面模块包括:
通过所述界面控件识别接口遍历所有可遍历的界面模块,并计算所述界面模块的界面树中的节点重复值,将所述节点重复值中最大的值作为所述界面模块的重复值;
通过将各个所述界面模块的重复值与所述阈值进行比较,得到重复值高于阈值的界面模块。
5.根据权利要求2所述界面文本检测方法,其特征在于,所述对所述界面树的节点对应的界面进行图像采集包括:
对当前节点获取节点标识,确定第一信息中是否包括所述节点标识,若不是,则对所述当前节点的界面进行图像采集,并根据所述节点标识更新所述第一信息。
6.根据权利要求1所述的界面文本检测方法,其特征在于,所述对所述图片执行第一识别包括:对所述图片执行预处理、切分、特征提取、特征匹配和/或合并处理。
7.根据权利要求1所述的界面文本检测方法,其特征在于,所述对所述文本执行第二识别,得到文本语种包括:将所述文本转换为Unicode编码,根据所述Unicode编码所在的区间确定所述文本对应的语种。
8.根据权利要求1所述的界面文本检测方法,其特征在于,所述方法还包括:输出预设数据结构,所述数据结构记录所述文本、所述文本的语种及所述文本对应的界面模块信息。
9.根据权利要求8所述的界面文本检测方法,其特征在于,所述方法还包括:
将所述数据结构中的所述文本依次进行自动化翻译,得到翻译文本;
将所述翻译文本根据对应的文本记录进数据结构中。
10.根据权利要求8所述的界面文本检测方法,其特征在于,所述方法还包括:将所述图片保存,并将所述图片的保存地址以超链接的方式记录到所述数据结构中。
11.根据权利要求1所述的界面文本检测方法,其特征在于,所述方法还包括:确定所述文本语种是否为第一语种,若是,则将所述文本输入自动化翻译工具,得到翻译文本。
12.一种界面文本检测系统,其特征在于,包括:
图像采集模块,用于对界面进行截图,得到图片;
第一识别模块,用于对所述图片进行第一识别,得到文本;
第二识别模块,用于对所述文本进行第二识别,得到文本语种。
13.计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于:执行权利要求1至11中任一项所述的界面文本检测检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海金山数字网络科技有限公司;广州西山居网络科技有限公司,未经珠海金山数字网络科技有限公司;广州西山居网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111531370.4/1.html,转载请声明来源钻瓜专利网。





