[发明专利]对图片进行文本检测的方法及装置有效
申请号: | 201511016818.3 | 申请日: | 2015-12-29 |
公开(公告)号: | CN105631426B | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 乔宇;黄韡林;贺通 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适用于计算机技术领域,提供了对图片进行文本检测的方法及装置,包括:获取进行文本检测的图片;将所述图片输入全卷积网络的第一层,在所述第一层中基于文本区域的序列特征,检测出所述图片中的文本区域;将所述文本区域输入到所述全卷积网络的第二层,在所述第二层中基于文本中间线的监督分类器,将所述文本区域分解为独立的文本行区域输出,所述文本中间线的区域由高斯分布的函数定义。本发明基于两层级联式的全卷积网络,对图片中的文本行进行提取,不仅充分节省了重叠区域之间的计算资源,而且利用了文本更高层的序列特征作为监督信息,提高了文本检测算法的鲁棒性。 | ||
搜索关键词: | 图片 进行 文本 检测 方法 装置 | ||
【主权项】:
1.一种对图片进行文本检测的方法,其特征在于,包括:获取进行文本检测的图片;将所述图片输入全卷积网络的第一层,在所述第一层中基于文本区域的序列特征,将文本区域和非文本区域的二分类函数作为误差函数输出一个和所述图片同样大小的热点图,通过设置阈值将文本区域从热点图中分割开来,检测出所述图片中的文本区域;将所述文本区域输入到所述全卷积网络的第二层,在所述第二层中基于文本中间线的监督分类器,将所述文本区域分解为独立的文本行区域输出,所述文本中间线的区域由高斯分布的函数定义,由区域的中间逐渐向两边递减,高斯分布的半径为0.25*H,所述H为文本区域最小面积文本框的高度;对所述卷积网络的第二层添加局部的文本区域约束,将文本区域的局部区域送入第一层网络重新进行文本区域检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201511016818.3/,转载请声明来源钻瓜专利网。
- 上一篇:环绕可揭式标签
- 下一篇:车载控制器局域网总线信息记录及转换输出装置