[发明专利]一种基于语义内容的图像裁剪方法及装置在审
| 申请号: | 201910142926.7 | 申请日: | 2019-02-26 |
| 公开(公告)号: | CN111612004A | 公开(公告)日: | 2020-09-01 |
| 发明(设计)人: | 田伟伟;董健;颜水成;卢禹锟 | 申请(专利权)人: | 北京奇虎科技有限公司 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
| 地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 语义 内容 图像 裁剪 方法 装置 | ||
本发明提供了一种基于语义内容的图像裁剪方法及装置,该方法包括:首先按照预设算法对待裁剪图像进行显著性计算,依据计算结果生成对应的显著性图,然后从显著性图中选取显著值的均值最大的区域作为候选裁剪区,进而计算待裁剪图像的语义信息的元数据,基于语义信息的元数据对候选裁剪区的裁剪边界进行调整,使候选裁剪区中的语义信息完整,最后依据调整后的裁剪边界对待裁剪图像的候选裁剪区进行裁剪。本发明方案对图像进行裁剪时通过基于图像显著性对图像进行裁剪,可以有效保留图像中显著性最高的区域,并且在对图像进行显著性裁剪之后,通过充分结合图像中的语义信息对图像进行裁剪,保证裁剪后的图像中的语义内容是完整的。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种基于语义内容的图像裁剪方法及装置。
背景技术
随着计算机技术的不断发展,越来越多的人们开始依赖移动终端(如手机)、电脑等终端设备获取信息、办公、学习、娱乐等,但是不同类型的终端设备往往会有固定的不同尺寸。因此,为了保证终端设备显示屏幕上显示的图像更好的符合屏幕大小,在图像数据进行展示时,往往要基于终端的显示尺寸对图像进行相应的裁剪,目前主流的裁剪方法是基于显著性进行裁剪,即保留原图像中显著性最高的区域作为裁剪目标。
但是,现有的图像裁剪方式并不能很好地保证图像语义描述单元(如文字、动态目标区域等)的完整性。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于语义内容的图像裁剪方法及装置。
依据本发明一方面,提供了一种基于语义内容的图像裁剪方法,包括:
按照预设算法对待裁剪图像进行显著性计算,依据计算结果生成对应的显著性图;
从所述显著性图中选取显著值的均值最大的区域作为候选裁剪区;
计算所述待裁剪图像的语义信息的元数据,基于所述语义信息的元数据对所述候选裁剪区的裁剪边界进行调整,使所述候选裁剪区中的语义信息完整;
依据调整后的裁剪边界对所述待裁剪图像的候选裁剪区进行裁剪。
可选地,按照预设算法对待裁剪图像进行显著性计算,包括:
对所述待裁剪图像进行预处理,使所述待裁剪图像符合裁剪需求;
按照预设算法对预处理后的待裁剪图像进行显著性计算。
可选地,对所述待裁剪图像进行预处理,包括:
对所述待裁剪图像的图像格式进行转换;和/或
对所述待裁剪图像的尺寸进行等比例缩放。
可选地,计算所述待裁剪图像的语义信息的元数据,包括:
采用预置深度神经网络模型计算所述待裁剪图像中语义信息的元数据。
可选地,所述待裁剪图像中的语义信息的元数据包括以下至少之一:
动态或静态的图像目标数据、人脸数据、文字数据。
可选地,动态或静态的图像目标数据包括:行人、景物、建筑、交通工具。
可选地,基于所述语义信息的元数据对所述候选裁剪区的裁剪边界进行调整,包括:
为各项语义信息的元数据设置裁剪优先级;
按照语义信息的元数据的裁剪优先级对所述候选裁剪区的裁剪边界进行调整。
可选地,为各项语义信息的元数据设置裁剪优先级,包括:
设置人脸数据的优先级最高,动态或静态的图像目标数据的优先级次之,文字数据的优先级最低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910142926.7/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





