[发明专利]一种文字识别方法和装置在审

专利信息
申请号: 201810974902.3 申请日: 2018-08-24
公开(公告)号: CN109376731A 公开(公告)日: 2019-02-22
发明(设计)人: 冯丹;马彬;魏晓明 申请(专利权)人: 北京三快在线科技有限公司
主分类号: G06K9/20 分类号: G06K9/20;G06K9/32;G06K9/62
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100083 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字区域 文字识别 文字内容 文字信息 录入 计算机可读存储介质 图像信息输入 图像 方法和装置 摄像头拍摄 电子设备 分类结果 图像文字 输出 分类 归类 噪声 保证
【说明书】:

发明公开了一种文字识别方法、装置、电子设备和计算机可读存储介质。该方法包括:获取摄像头拍摄的图像;定位所述图像上的文字区域;对文字区域进行分类;将文字区域的图像信息输入到文字识别模型,得到文字识别模型输出的文字信息;基于对文字区域的分类结果,将文字识别模型输出的文字信息归类到相应文字区域所属的类别。在本技术方案中,首先对文字区域进行分类,再进行文字区域的文字识别,防止在文字识别时因噪声和非同类文字的干扰造成的识别不准确。可见,通过本技术方案,可以准确识别图像文字区域的文字内容,保证文字内容录入的效率的同时,提高文字内容的录入的准确性,满足用户的使用需求,提高用户的使用体验。

技术领域

本发明涉及计算机技术领域,具体涉及一种文字识别方法、装置、电子设备和计算机可读存储介质。

背景技术

文字识别是指利用光学字符识别(OCR)技术从拍摄的图像中识别出其中的文字内容,实现文字内容的录入,通过该方法用户不必再手动进行文字内容的录入,操作简单,可提高文字录入的效率。例如,线下的实体餐馆入驻美团等线上平台,或使用电子收银系统时,需要实现菜单的电子化,以方便电子点餐系统进行管理。使用拍照录入方案录入菜名和菜价,不需要额外的设备,方便数量众多的商家录入。在文字识别中,为了保证录入的文字内容的准确性,对图像中的文字内容的准确识别至关重要。

在现有技术中,文字识别是通过获取图像,检测图像上的文字区域后,直接对文字区域的文字进行识别,获取相应的文字内容,再对文字内容进行分类。但是,这种方法会受到噪声或非同类文字内容的干扰,造成识别的不准确,影响文字内容的录入的准确性。例如,图1示出了现有技术中的菜单的文字识别方法的流程示意图,如图1所示,获取菜单图像后,在检测出菜单图像中的文字区域,对文字区域进行文字识别,识别出“燕京纯生500ml15元/瓶”、“德国啤酒500ml 25元/瓶”、“西班牙红酒500ml 188元/瓶”,获取上述文字内容后,再对文字内容进行分类,得到的分类结果是菜名“燕京纯生”、“德国啤酒”、“西班牙红酒”,菜价是“500元”、“500元”、“500元”,可见,在进行菜名菜价的拍照录入时,需要识别菜名和菜价两类文字,如果菜名中包含一些数字,若采用现有技术中的方法,会将菜名中的数字识别成菜品的价格,识别结果不准确,影响菜单的文字内容的录入的准确性。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的文字识别方法、装置、电子设备和计算机可读存储介质。

根据本发明的一个方面,提供了一种文字识别方法,该方法包括:

获取摄像头拍摄的图像;

定位所述图像上的文字区域;

对文字区域进行分类;

将文字区域的图像信息输入到文字识别模型,得到文字识别模型输出的文字信息;

基于对文字区域的分类结果,将文字识别模型输出的文字信息归类到相应文字区域所属的类别。

可选地,将文字区域的图像信息输入到文字识别模型包括:

将文字区域的图像信息输入到与该文字区域所属类别对应的文字识别模型,其中,不同的类别对应不同的文字识别模型。

可选地,所述对文字区域进行分类包括:

将文字区域的图像特征数据输入到第一分类模型中,得到第一分类模型输出的类别信息;

其中,第一分类模型是用一定数量的标记了类别的图像特征数据作为样本数据进行训练后得到。

可选地,所述对文字区域进行分类包括:

获取所述图像上文字区域的图像,将文字区域的图像输入到第二分类模型中,得到第二分类模型输出的类别信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810974902.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top