[发明专利]一种提取图片中的文本的方法和装置在审
申请号: | 201910132046.1 | 申请日: | 2019-02-22 |
公开(公告)号: | CN111612003A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 许亮;王晓燕;戴钰桀;郑志彤;桂创华;刘海锋 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/20 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;张效荣 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种提取图片中的文本的方法和装置,涉及计算机技术领域。该方法的一个具体实施方式包括:在待识别图片中划分多个文本框,其中文本框中包括文本像素点和非文本像素点;对多个文本框进行合并,合并的方法至少包括以下一种:确定相邻的文本框之间是否具有重叠部分,若具有重叠部分,则合并相邻的文本框;确定相邻的文本框之间的水平距离、竖直距离或凸包距离是否不大于预设阈值,若不大于预设阈值,则连通相邻的文本框;合并后,从文本框中提取文本。该实施方式能够提高提取文本的完整性,使得提取结果更准确,尤其适用于需要翻译的情况,可以使翻译结果更准确,并可以填充图片,提高大批量图片的识别和处理效率。 | ||
搜索关键词: | 一种 提取 图片 中的 文本 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910132046.1/,转载请声明来源钻瓜专利网。