[发明专利]用于对自然场景图像中文本的定位方法有效
申请号: | 201710781807.7 | 申请日: | 2017-09-02 |
公开(公告)号: | CN107563379B | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 宋彬;黄家冕;郭洁;王丹;秦浩 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 61205 陕西电子工业专利中心 | 代理人: | 田文英;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于全卷积神经网络自然场景文本定位方法。其步骤为:(1)输入待识别图像样本;(2)归一化处理;(3)构建并训练全卷积神经网络;(4)筛选全卷积神经网络输出的坐标参数;(5)对自然场景图像中的文本进行定位;本发明构建并训练全卷积神经网络,将自然场景下含有文本的图像作为输入,能够有效地解决现有技术中仅采用单一浅层的特征不足以表征深层次的文本信息,利用人工提取特征时导致计算量大及没有实现端到端自动文本定位的问题,本发明具有结合多种图像特征,获取更丰富更深层的文本信息,提高自然场景图像中的文本定位精度的优点。 | ||
搜索关键词: | 用于 自然 场景 图像 文本 定位 方法 | ||
【主权项】:
1.一种用于自然场景图像中文本的定位方法,其特征在于,包括如下步骤:/n(1)输入待识别的图像样本:/n(1a)从人工合成的含有文本图像数据集和自然场景阅读中文文本RCTW-17的训练数据集中,随机提取32000幅已知文本坐标的图像组成训练样本集;/n(1b)从自然场景中拍摄200幅含有文本的图像组成测试样本集;/n(2)归一化处理:/n(2a)将训练样本集和测试样本集的每个样本缩放到416×416大小,组成缩放后的训练样本集和测试样本集;/n(2b)对缩放后的训练样本集及测试样本集中每个样本的像素值进行归一化处理,得到归一化处理后的训练样本集和测试样本集;/n(3)构建并训练全卷积神经网络:/n(3a)构建含有23层的全卷积神经网络,其结构依次是,卷积层Conv1、卷积层Conv2、无采样卷积层NSConv3、低步卷积层LSConv4、卷积层Conv5、无采样卷积层NSConv6、低步卷积层LSConv7、卷积层Conv8、无采样卷积层NSConv9、低步卷积层LSConv10、无采样卷积层NSConv11、低步卷积层LSConv12、卷积层Conv13、无采样卷积层NSConv14、低步卷积层LSConv15、无采样卷积层NSConv16、低步卷积层LSConv17、无采样卷积层NSConv18、无采样卷积层NSConv19、无采样卷积层NSConv20、无采样卷积层NSConv21、低步卷积层LSConv22、输出层;/n(3b)将归一化处理后的训练样本集中的样本输入到全卷积神经网络中,对全卷积神经网络进行训练,直到全卷积神经网络输出层的输出向量的损失值小于等于10;/n(4)筛选全卷积神经网络输出向量中的坐标参数:/n(4a)从归一化处理后的测试样本集中获取一个未测试过的样本作为输入样本;/n(4b)将当前输入样本输入到训练好的全卷积神经网络中,得到当前样本的全卷积神经网络输出层的输出向量中的文本检测概率值和全卷积神经网络输出层的输出向量中的坐标参数;/n(4c)判定当前输入样本的输出向量中文本检测概率值是否大于等于0.6,若是,则执行步骤(4d),否则,执行步骤(4e);/n(4d)保留与当前输入样本的输出向量中文本检测概率值相对应的坐标参数,执行步骤(4f);/n(4e)舍弃与当前输入样本的输出向量中文本检测概率值相对应的坐标参数,执行步骤(4f);/n(4f)判断测试样本集中是否还有未测试过的样本,若是,则执行步骤(4a),否则,执行步骤(5);/n(5)对自然场景图像中的文本进行定位:/n利用保留下来全卷积神经网络输出层输出向量中的坐标参数,依次标定测试集样本中每个样本的文本。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710781807.7/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序