[发明专利]一种社交网络低质量图像中的字幕识别方法在审

申请号：	201610406013.8	申请日：	2016-06-08
公开（公告）号：	CN107480671A	公开（公告）日：	2017-12-15
发明（设计）人：	徐杰;陈训逊;包秀国;王博;王东安	申请（专利权）人：	国家计算机网络与信息安全管理中心
主分类号：	G06K9/32	分类号：	G06K9/32
代理公司：	北京华仲龙腾专利代理事务所(普通合伙)11548	代理人：	黄玉珏
地址：	北京市朝阳区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明为一种社交网络低质量图像中的字幕识别方法，包括(1)图像预处理；(2)MSER提取；(3)文字检测；(4)区域合成；(5)文本检测；最终获取识别结果。本发明支持对社交网络中低质量图像中字幕的检测。支持对低质量图像字幕的识别，低质量主要表现为字幕嵌入在复杂图像背景中、字幕中字符分辨率低，且笔画模糊，部分相邻字符粘连；支持识别常用低质量中英文字符、数字和标点符号，其中中文字符集至少包括GB2312‑1内的3755个简体汉字。
搜索关键词：	一种社交网络质量图像中的字幕识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种社交网络低质量图像中的字幕识别方法，其特征在于，包括如下步骤：(1)图像预处理；针对原始图像，首先提取出图像的灰度信息，再进行颜色空间变换，分别变换到YCrCb与Lab空间，选取Cr、Cb、a、b和gray五个通道进行MSER提取；(2)MSER提取；采用MSER子路径分割以及正则化variation定位规则，从图像中提取出初步的MSER区域，针对提取的MSER区域，采用启发式规则将其划分为候选字符与候选连体字符；(3)文字检测；采用LeNet模型检测候选字符；(4)区域合成；经过文字检测以后，保留下来的真字符经过区域合成算法进行组合，生成文本行，利用划分算法，将文本行划分出若干文本单词；(5)文本检测；区域合成生成的文本单词与MSER提取产生的候选连体字符采用AlexNet模型进行文本的检测，获取识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心，未经国家计算机网络与信息安全管理中心许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610406013.8/，转载请声明来源钻瓜专利网。

上一篇：一种字幕检测及提取的方法及设备
下一篇：图像识别方法及系统和自动聚焦控制方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种社交网络低质量图像中的字幕识别方法在审

专利文献下载