[发明专利]文本切割方法、装置、计算机设备和存储介质在审
申请号: | 201911032363.2 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110929721A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 田立文 | 申请(专利权)人: | 世纪保众(北京)网络科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 北京金蓄专利代理有限公司 11544 | 代理人: | 姚金良 |
地址: | 102600 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 切割 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种文本切割方法、装置、计算机设备和存储介质,所述方法包括:获取待训练的文本图像,并进行分解,获得多个图像训练数据;提取文本图像中的关键信息点,根据所述关键信息点生成多个怀疑文本框,并确定训练模型;根据所述图像训练数据对训练模型进行训练;将待测图片输入训练模型,生成关联的多个怀疑文本框;将所有关联怀疑文本框进行去重处理;将去重处理后的怀疑文本框拼接成接成连续文本框。采用本方法能从而精准切割文本,提升了文本切割的准确率和精准度。
技术领域
本申请涉及软件开发技术领域,特别是涉及一种文本切割方法、装置、计算机设备和存储介质。
背景技术
在保单(即保险单)OCR(Optical Character Recognition,光学字符识别)识别时需要将文本分行并截取,目前的方法中,一类是基于传统方式的水平投影或者垂直投影等对对象的特征提取来找到文本,另一类是基于深度学习目标检测来进行文本识别。
第一种方法常常会受到不同光线,不同角度等不确定因素的干扰而导致特征提取困难,无法用统一标准对文本进行精准截取,更无法对复杂情况的多文本,多角度进行精准定位。而第二种方法将文字作为目标进行检查,而保单在不同拍照环境常常会生成不同长度的文本,使得在截取识别时无法精准找到文本。因此,在文本图像出现扭曲歪斜而导致文本大小发生变形,或者角度发生变换时,现有技术无法对文本进行精准切割,导致误切或者漏切,这在保单OCR中很容易导致重要信息的遗漏,对用户体验很不友好。
发明内容
基于此,有必要针对上述技术问题,提供一种文本切割方法、装置、计算机设备和存储介质,从而精准切割文本,提升了文本切割的准确率和精准度。
一种文本切割方法,所述方法包括:
获取待训练的文本图像,并进行分解,获得多个图像训练数据;
提取文本图像中的关键信息点,根据所述关键信息点生成多个怀疑文本框,并确定训练模型;
根据所述图像训练数据对训练模型进行训练;
将待测图片输入训练模型,生成关联的多个怀疑文本框;
将所有关联怀疑文本框进行去重处理;
将去重处理后的怀疑文本框拼接成接成连续文本框。
在其中一个实施例中,对待训练的文本图像进行分解包括:
获取待训练的文本图像中的文本框坐标;
将获得的文本框坐标按照设定数值宽度进行平分,并存储为图像训练数据。
在其中一个实施例中,提取文本图像中的关键信息点,根据所述关键信息点生成多个怀疑文本框,并确定训练模型包括:
根据所述文本图像中的连接结构确定关键信息点,并获得关键信息点记录图;
将所述关键信息点记录图按照第一设定算法进行处理,确定关键信息点的顺序关系;
以关键信息点为中心确定多个怀疑框进行数据扩充;
将扩充后的怀疑框进行水平方向的回归并确定怀疑框的评分。
在其中一个实施例中,以关键信息点为中心确定多个怀疑框进行数据扩充包括:
以关键信息点为中心,确定以设定数值为像素宽,不同数值为像素高的多个怀疑框进行数据扩充。
在其中一个实施例中,还包括:
设置损失函数和训练参数,将分解得到的多个图像训练数据输入到训练模型中进行训练。
在其中一个实施例中,将所有关联怀疑文本框进行去重处理包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪保众(北京)网络科技有限公司,未经世纪保众(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911032363.2/2.html,转载请声明来源钻瓜专利网。