[发明专利]文本检测方法、模型训练方法及相关设备有效

申请号：	202011230246.X	申请日：	2020-11-06
公开（公告）号：	CN112464931B	公开（公告）日：	2021-07-30
发明（设计）人：	陈圣;蒋宁;王洪斌;周迅溢;吴海英;曾定衡	申请（专利权）人：	马上消费金融股份有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/34;G06K9/42;G06K9/62;G06N3/04;G06T7/11
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	许静;黄灿
地址：	404100 重庆市渝北区***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本检测方法模型训练相关设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种文本检测方法、模型训练方法及相关设备，该方法包括：文本检测方法包括：对目标图像进行文本检测，获得至少一个文本区域；将每一所述文本区域进行分割获得至少一个文本图像块；将每一所述文本图像块的尺寸调整为预设尺寸；将调整后的所述文本图像块输入至预先训练的分类模型中获得第一置信度，所述第一置信度用于确定所述文本图像块包括手写体文本的概率。本申请实施例可以避免手写体文本对文本识别准确度的影响。

技术领域

本申请涉及图像处理技术领域，尤其涉及一种文本检测方法、模型训练方法及相关设备。

背景技术

随着视频或图像处理等技术的发展，在图像中实现文本的自动识别和检测得到了广泛的应用。传统技术中，针对图像中文字的识别通常是统一进行识别，当存在用户手写输入的文本时，通常无法正确的识别出手写的文本，从而导致识别出错。因此，现有技术中存在手写体文本影响文本识别准确度的问题。

发明内容

本申请实施例提供一种文本检测方法、模型训练方法及相关设备，以解决手写体文本影响文本识别准确度的问题。

第一方面，本申请实施例提供了一种文本检测方法，包括：

对目标图像进行文本检测，获得至少一个文本区域；

将每一所述文本区域进行分割获得至少一个文本图像块；

将每一所述文本图像块的尺寸调整为预设尺寸；

将调整后的所述文本图像块输入至预先训练的分类模型中获得第一置信度，所述第一置信度用于表示所述文本图像块包括手写体文本的概率。

第二方面，本申请实施例提供了一种分类模型训练方法，包括：

利用第一样本数据集中的文本图像块对卷积神经网络进行训练得到分类模型；

其中，所述第一样本数据集中的文本图像块的尺寸均为预设尺寸，所述第一样本数据集包括第一类文本图像块和第二类文本图像块，所述第一类文本图像块为包括手写体文本的文本图像块，所述第二类文本图像块为包括印刷体文本的文本图像块，所述卷积神经网络为使用混合深度卷积核结构构建的。

第三方面，本申请实施例提供了一种模糊判断模型训练方法，包括：

利用第二样本数据集中的文本图像块对待训练的模糊判断模型进行训练得到模糊判断模型；

其中，所述第一样本数据集中的文本图像块的尺寸均为预设尺寸，所述第一样本数据集包括第一类文本图像块和第二类文本图像块，所述第一类文本图像块为包括手写体文本的文本图像块，所述第二类文本图像块为包括印刷体文本的文本图像块，所述模糊判断模型包括浅层特征提取网络层、交叉注意模块、全局池化网络层、第一全连接网络层和第一softmax函数。

第四方面，本申请实施例提供了一种文本检测装置，包括：

检测模块，用于对目标图像进行文本检测，获得至少一个文本区域；

分割模块，用于将每一所述文本区域进行分割获得至少一个文本图像块；

调整模块，用于将每一所述文本图像块的尺寸调整为预设尺寸；

输入模块，将调整后的所述文本图像块输入至预先训练的分类模型中获得第一置信度，所述第一置信度用于表示所述文本图像块包括手写体文本的概率。

第五方面，本申请实施例提供了一种分类模型训练装置，包括：

第一训练模块，用于利用第一样本数据集中的文本图像块对卷积神经网络进行训练得到分类模型；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司，未经马上消费金融股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011230246.X/2.html，转载请声明来源钻瓜专利网。