[发明专利]一种图像文字识别方法和装置在审
申请号: | 201210279368.7 | 申请日: | 2012-08-07 |
公开(公告)号: | CN102855480A | 公开(公告)日: | 2013-01-02 |
发明(设计)人: | 韩钧宇;丁二锐;吴中勤;文林福 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文字 识别 方法 装置 | ||
【技术领域】
本发明涉及计算机应用技术领域,特别涉及一种图像文字识别的方法和装置。
【背景技术】
随着移动互联网的迅速发展,基于移动终端摄像头采集到的图像的应用越来越广泛。其中图像文字识别技术将图像中的文字进行识别,转换为文本文字,从而减轻了用户输入对应文字信息的负担,方便用户存储、编辑对应的文字信息。
在实际应用过程中存在如下情况,用户通过移动终端拍摄的图像中,有很多是用户不认识或者用户了解的文字,例如一些生僻字、诗词等,这种情况下,用户除了想提取这些文字内容之外还想进一步了解文字的知识信息,现有图像文字识别技术则无法解决该问题,用户需要通过手工方式进行进一步查询,例如查询字典或者手工输入搜索引擎中进行查询。
【发明内容】
有鉴于此,本发明提供了一种图像文字识别方法和装置,以便于方便用户获取图像文字的知识信息。
具体技术方案如下:
一种图像文字识别的方法,该方法包括:
S1、获取待识别图像中的文字区域;
S2、对所述文字区域进行文字识别;
S3、利用识别结果查询知识库获得识别结果对应的知识信息;
S4、在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。
根据本发明一优选实施例,所述步骤S1具体包括:
服务器接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,
服务器接收移动终端从待识别图像中提取并发送来的文字区域。
根据本发明一优选实施例,所述步骤S2具体包括:
对文字区域进行二值化;
对二值化后的文字区域分割为各字块;
提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果;
按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
根据本发明一优选实施例,所述步骤S3具体包括以下中的一种或任意组合:
查询文字词典库获得文字的读音、含义、用法或其他语种的翻译信息;
查询文化知识库获得文字对应的典故或出处信息;
查询书籍查询库获得文字对应的书籍信息或网络资源信息;
查询商品查询库获得文字对应的商品信息;
查询音乐查询库获得文字对应的音乐信息或网络资源信息;
查询网络应用搜索库获得文字对应的网络应用信息或网络入口。
根据本发明一优选实施例,在所述步骤S3中查询所有知识库,将获得的所有知识信息生成知识拓展词包;或者,
在所述步骤S1中还获取用户选择的个性化选项内容,在所述步骤S3中查询所述个性化选项内容对应的知识库,将获得的知识信息生成知识拓展词包;或者,
在所述步骤S3中查询所有知识库,对查询到的知识信息进一步确定知识信息对应的权重,将权重值排在前N个的知识信息生成知识拓展词包,N为预设的正整数。
根据本发明一优选实施例,所述知识信息对应的权重采用以下方式确定:
根据知识信息被查询到的总次数确定该知识信息对应的权重,总次数越大权重值越大;或者,
利用知识信息被查询到的总次数确定该知识信息对应的知识权重,利用该知识信息所属类别的所有知识信息被当前用户查看的总次数确定用户个性化权重,利用知识信息的知识权重与用户个性化权重的乘积确定该知识信息对应的权重。
一种图像文字识别的装置,该装置包括:
区域获取单元,用于获取待识别图像中的文字区域;
文字识别单元,用于对所述文字区域进行文字识别;
知识查询单元,用于所述文字识别单元的识别结果查询知识库获得识别结果对应的知识信息;
结果推送单元,用于在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。
根据本发明一优选实施例,所述区域获取单元接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。
根据本发明一优选实施例,所述文字识别单元具体执行:对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
根据本发明一优选实施例,所述知识查询单元具体执行以下中的一种或任意组合:
查询文字词典库获得文字的读音、含义、用法或其他语种的翻译信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210279368.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:抄表系统及方法
- 下一篇:洗衣机悬挂装置及洗衣机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序