[发明专利]文本切割方法、装置、计算机设备和存储介质在审
申请号: | 201911032363.2 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110929721A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 田立文 | 申请(专利权)人: | 世纪保众(北京)网络科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 北京金蓄专利代理有限公司 11544 | 代理人: | 姚金良 |
地址: | 102600 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 切割 方法 装置 计算机 设备 存储 介质 | ||
1.一种文本切割方法,其特征在于,所述方法包括:
获取待训练的文本图像,并进行分解,获得多个图像训练数据;
提取文本图像中的关键信息点,根据所述关键信息点生成多个怀疑文本框,并确定训练模型;
根据所述图像训练数据对训练模型进行训练;
将待测图片输入训练模型,生成关联的多个怀疑文本框;
将所有关联怀疑文本框进行去重处理;
将去重处理后的怀疑文本框拼接成接成连续文本框。
2.根据权利要求1所述的方法,其特征在于,对待训练的文本图像进行分解包括:
获取待训练的文本图像中的文本框坐标;
将获得的文本框坐标按照设定数值宽度进行平分,并存储为图像训练数据。
3.根据权利要求1所述的方法,其特征在于,提取文本图像中的关键信息点,根据所述关键信息点生成多个怀疑文本框,并确定训练模型包括:
根据所述文本图像中的连接结构确定关键信息点,并获得关键信息点记录图;
将所述关键信息点记录图按照第一设定算法进行处理,确定关键信息点的顺序关系;
以关键信息点为中心确定多个怀疑框进行数据扩充;
将扩充后的怀疑框进行水平方向的回归并确定怀疑框的评分。
4.根据权利要求3所述的方法,其特征在于,以关键信息点为中心确定多个怀疑框进行数据扩充包括:
以关键信息点为中心,确定以设定数值为像素宽,不同数值为像素高的多个怀疑框进行数据扩充。
5.根据权利要求1所述的方法,其特征在于,还包括:
设置损失函数和训练参数,将分解得到的多个图像训练数据输入到训练模型中进行训练。
6.根据权利要求1所述的方法,其特征在于,将所有关联怀疑文本框进行去重处理包括:
通过非极大值抑制算法对所有关联怀疑文本框进行去重处理。
7.根据权利要求1所述的方法,其特征在于,将去重处理后的怀疑文本框拼接成接成连续文本框包括:
按照水平方向对去重处理后的怀疑文本框进行排序。
8.一种文本切割装置,其特征在于,所述装置包括:
获取模块,适于获取待训练的文本图像,并进行分解,获得多个图像训练数据;
第一怀疑文本框生成模块,适于提取文本图像中的关键信息点,根据所述关键信息点生成多个怀疑文本框,并确定训练模型;
训练模块,适于根据所述图像训练数据对训练模型进行训练;
第二怀疑文本框生成模块,适于将待测图片输入训练模型,生成关联的多个怀疑文本框;
去重模块,适于将所有关联怀疑文本框进行去重处理;
拼接模块,适于将去重处理后的怀疑文本框拼接成接成连续文本框。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪保众(北京)网络科技有限公司,未经世纪保众(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911032363.2/1.html,转载请声明来源钻瓜专利网。