[发明专利]一种社交网络低质量图像中的字幕识别方法在审
申请号: | 201610406013.8 | 申请日: | 2016-06-08 |
公开(公告)号: | CN107480671A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 徐杰;陈训逊;包秀国;王博;王东安 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京华仲龙腾专利代理事务所(普通合伙)11548 | 代理人: | 黄玉珏 |
地址: | 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明为一种社交网络低质量图像中的字幕识别方法,包括(1)图像预处理;(2)MSER提取;(3)文字检测;(4)区域合成;(5)文本检测;最终获取识别结果。本发明支持对社交网络中低质量图像中字幕的检测。支持对低质量图像字幕的识别,低质量主要表现为字幕嵌入在复杂图像背景中、字幕中字符分辨率低,且笔画模糊,部分相邻字符粘连;支持识别常用低质量中英文字符、数字和标点符号,其中中文字符集至少包括GB2312‑1内的3755个简体汉字。 | ||
搜索关键词: | 一种 社交 网络 质量 图像 中的 字幕 识别 方法 | ||
【主权项】:
一种社交网络低质量图像中的字幕识别方法,其特征在于,包括如下步骤:(1)图像预处理;针对原始图像,首先提取出图像的灰度信息,再进行颜色空间变换,分别变换到YCrCb与Lab空间,选取Cr、Cb、a、b和gray五个通道进行MSER提取;(2)MSER提取;采用MSER子路径分割以及正则化variation定位规则,从图像中提取出初步的MSER区域,针对提取的MSER区域,采用启发式规则将其划分为候选字符与候选连体字符;(3)文字检测;采用LeNet模型检测候选字符;(4)区域合成;经过文字检测以后,保留下来的真字符经过区域合成算法进行组合,生成文本行,利用划分算法,将文本行划分出若干文本单词;(5)文本检测;区域合成生成的文本单词与MSER提取产生的候选连体字符采用AlexNet模型进行文本的检测,获取识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610406013.8/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序