[发明专利]一种长文本资料的文本识别方法有效
| 申请号: | 202210245889.4 | 申请日: | 2022-03-14 |
| 公开(公告)号: | CN114359889B | 公开(公告)日: | 2022-06-21 |
| 发明(设计)人: | 杜博文 | 申请(专利权)人: | 北京智源人工智能研究院 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/24;G06V30/12;G06N3/04;G06N3/08 |
| 代理公司: | 北京动力号知识产权代理有限公司 11775 | 代理人: | 梁艳 |
| 地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 资料 识别 方法 | ||
1.一种长文本资料的文本识别方法,其特征在于,包括:
获取长文本资料的待检测图像;
使用用于检测长文本的场景文字检测模型对所述待检测图像中的文本进行文本框检测,获取多个预测点及各预测点对应的文本框;
根据各个所述文本框内的文本行识别所述待检测图像的扭曲状态是否超过预设状态,若是,则对该待检测图像进行扭曲矫正;
对扭曲矫正后的待检测图像进行文本识别;
所述获取长文本资料的待检测图像包括:
获取长文本资料图像;
分别计算所述长文本资料图像的RGB三个通道的每个像素点为中心的正方形内所有像素点的平均值,以分别得到与所述长文本资料图像同尺寸的R通道对应的矩阵、G通道对应的矩阵和B通道对应的矩阵;
分别将所述长文本资料图像与各个所述矩阵的比值拉至预设范围内,得到待检测图像。
2.如权利要求1所述的长文本资料的文本识别方法,其特征在于,所述长文本资料图像为用户手持终端设备拍摄的长文本医疗资料图像。
3.如权利要求1所述的长文本资料的文本识别方法,其特征在于,所述用于检测长文本的场景文字检测模型中的特征提取层的主干网络为目标网络,和/或,所述用于检测长文本的场景文字检测模型中的输出层设有反卷积模块;
其中,所述目标网络包括VGG16、VGG19、ResNet101、ResNet152、InceptionV1、InceptionV2、InceptionV3、InceptionV4、Inception-ResNet-V1、Inception-ResNet-V2、DenseNet、MobileNetV1、MobileNetV2和MobileNetV3中任一项。
4.如权利要求1所述的长文本资料的文本识别方法,其特征在于,在所述使用用于检测长文本的场景文字检测模型对所述待检测图像中的文本进行文本框检测之前,还包括:
获取包含有ResNet50的原始场景文字检测模型,且该原始场景文字检测模型的特征提取层中设有双线性插值模块;
将所述ResNet50替换为目标网络,和/或,将所述双线性插值模块替换为反卷积模块;
其中,所述目标网络包括VGG16、VGG19、ResNet101、ResNet152、InceptionV1、InceptionV2、InceptionV3、InceptionV4、Inception-ResNet-V1、Inception-ResNet-V2、DenseNet、MobileNetV1、MobileNetV2和MobileNetV3中任一项。
5.如权利要求3或4所述的长文本资料的文本识别方法,其特征在于,所述使用用于检测长文本的场景文字检测模型对所述待检测图像中的文本进行文本框检测,获取多个预测点及各预测点对应的文本框包括:
基于所述用于检测长文本的场景文字检测模型的目标网络对所述待检测图像进行特征提取,得到各个初始预测点各自预测得到的文本框的四个顶点的坐标;
对各个初始预测点分别进行文本框权重的动态调整及特征融合,以形成重新分组后的各个预测点各自所在的文本行对应的文本框。
6.如权利要求5所述的长文本资料的文本识别方法,其特征在于,所述对各个初始预测点分别进行文本框权重的动态调整及特征融合,包括:
对交并比达到阈值的文本框进行融合,得到每一文本行各自对应的一个初始文本框;
将位于同一个文本框内的预测点划分为一组;计算每一组各个预测点与所在文本框四个顶点之间的空间距离,并根据该空间距离得到该顶点的权重,根据权重重新计算该顶点的位置;迭代该步骤,直至顶点的位置收敛或者到达最大步长,得到各文本行最终的文本框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智源人工智能研究院,未经北京智源人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210245889.4/1.html,转载请声明来源钻瓜专利网。





