[发明专利]用于搜索控制的方法、装置、设备和介质有效
申请号: | 201911142528.1 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110929093B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 张柳清;李国洪;余永佳 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/73 | 分类号: | G06F16/73 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉;罗利娜 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 搜索 控制 方法 装置 设备 介质 | ||
本申请公开了搜索控制的方法、装置、设备和介质,涉及视觉搜索领域。一种用于搜索控制的方法包括从由电子设备采集到的视频中获取目标时刻的第一帧和与第一帧邻近的第二帧;确定第一帧与第二帧之间的位移幅度;以及基于位移幅度与第一预定阈值的比较来确定用户对第一帧的搜索意图。由此,可以从视频中准确、快速判断用户对位移程度较低、稳定性较好的帧的搜索意图,降低用户在具有搜索意图时的等待时间,并且可以在用户具有搜索意图时利用更稳定、图像质量更好的帧用于执行视觉搜索,提高搜索结果的质量。
技术领域
本公开的实施例主要涉及图像处理领域,并且更具体地,涉及视觉搜索领域。
背景技术
视觉搜索是一种以图像、视频等视觉内容作为搜索输入,利用视觉识别相关技术,对输入的视觉内容执行检索,并返回相关图像、文字等多种形态的搜索结果的技术。随着视觉识别技术的不断发展,越来越多的用户在移动终端上通过视觉搜索来满足感知周边物体的搜索需求。
在用于帮助用户感知周边世界的视觉搜索方案中,主要以静态图像搜索为主,即将静态图像作为搜索输入。这样的搜索妨碍存在用户操作多、连续搜索效率低等问题。目前还提出了视频搜索方案,对实时视频流中的一个或多个目标执行连续搜索,实现了“扫哪识别哪”的连续多次目标搜索识别的能力,解决了以图像搜索为主的视觉搜索产品所面临的问题,提升了搜索效率。然而,由于视频流是动态的,由多个连续帧构成,如何判断执行搜索的时机将影响搜索的总体性能。
发明内容
根据本公开的实施例,提供了一种用于搜索控制的方案。
在本公开的第一方面中,提供了一种用于搜索控制的方法。该方法包括:从由电子设备采集到的视频中获取目标时刻的第一帧和与第一帧邻近的第二帧;确定第一帧与第二帧之间的位移幅度;以及基于位移幅度与第一预定阈值的比较来确定用户对第一帧的搜索意图。
在本公开的第二方面中,提供了一种用于搜索控制的装置。该装置包括帧获取模块,被配置为从由电子设备采集到的视频中获取目标时刻的第一帧和与第一帧邻近的第二帧;位移确定模块,被配置为确定第一帧与第二帧之间的位移幅度;以及意图确定模块,被配置为基于位移幅度与第一预定阈值的比较来确定用户对第一帧的搜索意图。
在本公开的第三方面中,提供了一种电子设备。该电子设备包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种计算机可读存储介质。该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
图1示出了本公开的多个实施例能够在其中实现的用于搜索控制的环境的示意图;
图2示出了根据本公开的一些实施例的用于搜索控制的过程的流程图;
图3示出了根据本公开的另一些实施例的用于搜索控制的过程的流程图;
图4示出了根据本公开的一些实施例的用于搜索控制的装置的框图;以及
图5示出了能够实施本公开的多个实施例的设备的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911142528.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于近似动态规划算法的博弈决策方法及系统
- 下一篇:一种高互调的AFU天线