[发明专利]文本框选方法、装置、终端设备及计算机可读存储介质在审
| 申请号: | 201911172772.2 | 申请日: | 2019-11-26 |
| 公开(公告)号: | CN110942065A | 公开(公告)日: | 2020-03-31 |
| 发明(设计)人: | 吴恒刚 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20 |
| 代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张瑞志 |
| 地址: | 523860 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本框 方法 装置 终端设备 计算机 可读 存储 介质 | ||
本申请适用于视频处理技术领域,提供了文本框选方法、装置、终端设备及计算机可读存储介质,包括:若检测到视频录制指令,则通过摄像头获取图像帧并发送至硬件抽象层HAL;若检测到所述HAL输出图像帧序列,则采用目标算法分别对所述图像帧序列的图像帧进行文本识别,得到文本识别结果,其中,所述目标算法通过GPU运行,所述文本识别结果包括文本区域信息;根据所述目标算法输出的文本识别结果绘制对应的图像帧的文本框;生成绘制了文本框的图像帧序列。通过上述方法能够保证及时生成具有文本框的图像帧序列。
技术领域
本申请属于视频处理技术领域,尤其涉及文本框选方法、装置、终端设备及计算机可读存储介质。
背景技术
目前,终端设备(如手机)在获得拍摄照片后,能够对照片的文本进行识别,进而框选出识别的文本。
但是,上述文本框选方法只适用于拍摄的照片,而终端设备除了具有拍照功能,还具有其他功能,因此,需要提供一种新的文本框选方法,以满足用户的不同需求。
发明内容
本申请实施例提供了文本框选方法、装置、终端设备及计算机可读存储介质,可以解决现有的文本框选方法难以满足用户的不同需求的问题。
第一方面,本申请实施例提供了一种文本框选方法,所述文本框选方法应用于终端设备,所述文本框选方法包括:
若检测到视频录制指令,则通过摄像头获取图像帧并发送至硬件抽象层HAL;
若检测到所述HAL输出图像帧序列,则采用目标算法分别对所述图像帧序列的图像帧进行文本识别,得到文本识别结果,其中,所述目标算法通过GPU运行,所述文本识别结果包括文本区域信息;
根据所述目标算法输出的文本识别结果绘制对应的图像帧的文本框;
生成绘制了文本框的图像帧序列。
第二方面,本申请实施例提供了一种文本框选装置,所述文本框选装置应用于终端设备,所述文本框选装置包括:
图像帧获取单元,用于若检测到视频录制指令,则通过摄像头获取图像帧并发送至硬件抽象层HAL;
文本识别单元,用于若检测到所述HAL输出图像帧序列,则采用目标算法分别对所述图像帧序列的图像帧进行文本识别,得到文本识别结果,其中,所述目标算法通过GPU运行,所述文本识别结果包括文本区域信息;
文本框绘制单元,用于根据所述目标算法输出的文本识别结果绘制对应的图像帧的文本框;
绘制文本框的图像帧序列生成单元,用于生成绘制了文本框的图像帧序列。
第三方面,本申请实施例提供了一种终端设备,包括摄像头、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中所述的方法。
本申请实施例与现有技术相比存在的有益效果是:
采用目标算法分别对HAL输出的图像帧序列进行文本识别,得到不同图像帧对应的文本识别结果,由于文本识别结果包括文本区域信息,因此能够结合该文本区域信息绘制对应的图像帧的文本框,进而生成绘制了文本框的图像帧序列,即生成绘制了文本框的视频流。且由于设置目标算法由GPU运行,而GPU能够及时响应与图像处理有关的请求,因此能够保证及时生成具有文本框的图像帧序列,即能够满足对图像帧序列实现文本框选的需要。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911172772.2/2.html,转载请声明来源钻瓜专利网。





