[发明专利]使用移动设备系统的数字图像存档和检索有效

专利信息
申请号: 200780050269.9 申请日: 2007-11-28
公开(公告)号: CN101589389A 公开(公告)日: 2009-11-25
发明(设计)人: 克里希讷杜·乔杜里;阿舒托什·加尔格;帕拉森吉特·普坎;阿尔文德·萨拉弗 申请(专利权)人: 谷歌公司
主分类号: G06F17/30 分类号: G06F17/30;G06K9/00
代理公司: 中原信达知识产权代理有限责任公司 代理人: 张焕生;安 翔
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 移动 设备 系统 数字图像 存档 检索
【说明书】:

背景技术

本说明书讨论信息组织系统和方法,并且更具体地,讨论与文档 的自动化存档和检索相关的特征。

在每天的生活中,人们频繁地接收带有可能重要或不重要、以后 可能需要或不需要的信息的物理文档。例如,经常在一天中接收到凭 条和名片,而接受者经常不确定是否要保存这种文档以及要保存多长 时间。这种文档能够被物理地保存或扫描用于在计算上存储。不管怎 样,该保存的文档通常在没有任何存档元信息的情况下被随便放在某 个位置(例如,随便放进抽屉或文件夹),或者人们必须有意地将存 档元信息与文档关联(例如,通过根据某个备案系统将文档放置在特 定的文件夹中,或者通过录入信息来与计算机上保存的文档关联)。

发明内容

该说明书描述了涉及文档存档的方法和系统。这些方法和系统允 许用户存储并且容易地检索物理文档的数字表示。能够使用光学字符 识别(OCR)技术来处理物理文档的数字图像,并且随后被索引并且 存储,用于后来的检索。能够将图像获取、OCR处理和图像存档组合 进端对端系统中,它能够促进每天的生活中所遇到的无数文档(例如, 凭条、名片、医生的处方、票据、合同等)的管理,并且在一些实现 中,该系统的用户仅需要拍摄照片来触发文档存档过程。

系统的用户能够容易地存档文档的数字图像(和将文档丢进抽屉 一样简单和随意),并且还能够使用关键字搜索来容易地检索数字图 像。安装在蜂窝电话中的数字照相机能够被用来捕捉图像,并且OCR 技术能够被用来从这些图像识别并且提取相关的关键字,以允许后来 的有效搜索。能够从移动设备直接将获取的文档图像传递到后端系统 (例如,移动网关和电子邮件服务器)。系统用户无需将图像从移动 设备下载到个人计算机来存档和存储该图像,因此使得图像存档对用 户而言是个简单的过程。此外,还能够使用增强的OCR技术来处理较 低分辨率的图像,增强的OCR技术包括各种预处理和后处理操作。因 此,在每天的生活中所遇到的无数文档能够被容易地数字化、组织、 迅速而有效地存储和检索。

一般来说,本说明书中所描述的主题的一方面能够被实现为一种 计算机实现的方法,该方法包括:从被配置成连接到移动设备网络的 移动设备接收消息,该移动设备包括数字照相机,并且该消息包括由 数字照相机所拍摄的数字图像并且包括对应于词(word)的信息;使 用光学字符识别从数字图像信息确定词;基于该词索引数字图像;以 及存储该数字图像,用于后来的基于一个或多个接收到的搜索词语的 对数字图像的检索。该方法能够进一步包括接收一个或多个搜索词语; 以及基于该一个或多个搜索词语检索数字图像。

该方法能够包括验证移动设备(例如,基于移动电话号码和/或与 接收到的数字图像相关联的信息)。接收消息能够包括接收附有数字 图像的电子邮件消息;并且该方法能够包括向电子邮件消息添加词以 及对应于移动设备的预定义标签中的至少一个;并且能够在电子邮件 系统中执行确定、索引和存储。

接收数字图像能够包括接收响应于到数字照相机的单个输入而对 单个物体拍摄的至少两个数字图像;并且确定词能够包括对该至少两 个数字图像执行关联(correlative)光学字符识别以找到词。确定词能 够包括以多比例(scale)执行光学字符识别。

该方法能够包括预处理数字图像以改善光学字符识别。该预处理 能够包括通过最小化数字图像中所表示的文档的左右页边空白 (margin)的位置差异来识别用于该数字图像的二值化阈值。该预处理 能够包括通过迭代地获取在较低分辨率的邻近像素的灰度级的加权组 合来获得较高分辨率像素的灰度级。

该方法能够包括后处理词以识别并且纠正由光学字符识别引起的 常见字符误识别。接收消息能够包括接收用于在数字图像中所表示的 文档的类型指示,并且后处理能够包括根据用于该文档的类型指示在 至少两个基于词典的语言模型之间选择,并且根据选择的基于词典的 语言模型来对词进行后处理。此外,接收类型指示能够包括接收消息 中用户指定的分类,该用户指定的分类选自包括名片和信用卡凭条的 组。

该方面的其它实施例包括对应的系统、装置以及一个或多个计算 机程序产品,即,编码在计算机可读介质上的计算机程序指令的一个 或多个模块,用于由数据处理装置执行或用以控制数据处理装置的操 作。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200780050269.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top