[发明专利]基于手绘图形的文档检索在审
申请号: | 202210100572.1 | 申请日: | 2022-01-27 |
公开(公告)号: | CN116561359A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 毕然;李迎霞;王玉旺;张晓艺 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/532 | 分类号: | G06F16/532;G06F16/58;G06F16/583 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 手绘 图形 文档 检索 | ||
本公开提供了用于基于手绘图形的文档检索的方法、装置和计算机程序产品。可以获得输入的手绘图形。可以通过特征提取模型,提取所述手绘图形的手绘图形特征。可以利用所述手绘图形特征和与多个候选文档相关联的特征索引库,检索至少一个目标文档,所述目标文档中的至少一个文档页面局部匹配于所述手绘图形。
背景技术
各种计算环境的用户可能希望通过信息检索(retrieval)服务来检索或搜索到感兴趣的信息或内容。例如,操作系统的用户可能希望在本地存储中找到特定的文档。操作系统通常提供用于文档检索的文档检索服务以帮助用户在本地找到感兴趣的文档。此外,例如,网络用户可能希望利用搜索引擎在网络上找到感兴趣的网页内容。搜索引擎可以提供搜索服务以响应于用户的搜索查询而返回搜索结果。一些搜索引擎可以提供用于图像检索的图像搜索服务,其能够根据用户提供的输入图像而返回与该输入图像匹配的图像搜索结果。
发明内容
提供本发明内容以便介绍一组概念,这组概念将在以下的具体实施方式中做进一步描述。本发明内容并非旨在标识所保护主题的关键特征或必要特征,也不旨在用于限制所保护主题的范围。
本公开的实施例提出了用于基于手绘图形的文档检索的方法、装置和计算机程序产品。可以获得输入的手绘图形。可以通过特征提取模型,提取所述手绘图形的手绘图形特征。可以利用所述手绘图形特征和与多个候选文档相关联的特征索引库,检索至少一个目标文档,所述目标文档中的至少一个文档页面局部匹配于所述手绘图形。
应当注意,以上一个或多个方面包括以下详细描述以及权利要求中具体指出的特征。下面的说明书及附图详细提出了所述一个或多个方面的某些说明性特征。这些特征仅仅指示可以实施各个方面的原理的多种方式,并且本公开旨在包括所有这些方面和其等同变换。
附图说明
以下将结合附图描述所公开的多个方面,这些附图被提供用以说明而非限制所公开的多个方面。
图1示出了根据实施例的手绘图形和文档页面图像的示例。
图2示出了根据实施例的基于手绘图形的文档检索的示例性过程。
图3示出了根据实施例的建立特征索引库的示例性过程。
图4示出了根据实施例的训练特征提取模型的示例性过程。
图5A至图5F示出了根据实施例的数据增强的示例。
图6A至图6C示出了根据实施例的示例性用户界面。
图7示出了根据实施例的用于基于手绘图形的文档检索的示例性方法的流程图。
图8示出了根据实施例的用于基于手绘图形的文档检索的示例性装置。
图9示出了根据实施例的用于基于手绘图形的文档检索的示例性装置。
具体实施方式
现在将参考多种示例性实施方式来讨论本公开。应当理解,这些实施方式的讨论仅仅用于使得本领域技术人员能够更好地理解并从而实施本公开的实施例,而并非教导对本公开的范围的任何限制。
通常,由操作系统所提供的文档检索服务可以接收用户输入的关键词,并且返回包含该关键词的文档的列表。这种文档检索服务往往只能够支持基于关键词的文档检索,而不能支持图像检索,即,不能支持基于输入图像来执行文档检索。此外,通常,由搜索引擎所提供的图像搜索服务可以接收用户上传的作为搜索查询的输入图像,然后,在网络上搜索与输入图像匹配的图像,并且提供包含所搜索到的图像或其链接的搜索结果。这种图像搜索服务是基于图像全局匹配的,其旨在找到与输入图像完全相同或尽可能相似的图像,例如,所搜索到的图像的整体应当与输入图像的整体相同或尽可能相似。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210100572.1/2.html,转载请声明来源钻瓜专利网。