[发明专利]图像处理方法、装置和计算机可读存储介质在审
申请号: | 201910698145.6 | 申请日: | 2019-07-31 |
公开(公告)号: | CN111782847A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 白亚龙;梁远智;张炜;梅涛 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F16/55;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 张雷;方亮 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 计算机 可读 存储 介质 | ||
本公开涉及一种图像处理方法、装置和计算机可读存储介质,涉及人工智能技术领域。该方法包括:根据各物体的描述标签,利用机器学习模型预测各物体之间的关系隶属于第一关系数据库中的哪个关系标签;从第一关系数据库中滤除预测准确率大于阈值的各关系标签,以确定第二关系数据库;根据第二关系数据库,确定待处理图片中各物体的关系。本公开的技术方案能够提高关系确定的准确性。
技术领域
本公开涉及人工智能技术领域,特别涉及一种图像处理方法、图像处理装置和计算机可读存储介质。
背景技术
关系标签数据作为联系图像中各物体的纽带,能够串联场景中的多个物体,从而得到更好的场景语义的建模。因此,表述图片中的物体对象之间的关系对理解场景语义有着重大的作用和意义。
在相关技术中,对关系数据库中的关系标签进行出现频率统计,对出现频率较高的关系进行建模。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:仅依靠标签语义信息的统计特性确定关系,在标签缺乏多样性的情况下,使得在确定图像中各物体关系的过程中出现统计偏向性,从而导致关系确定的准确性差。
鉴于此,本公开提出了一种图像处理技术方案,能够提高关系确定的准确性。
根据本公开的一些实施例,提供了一种图像处理方法,包括:根据各物体的描述标签,利用机器学习模型预测所述各物体之间的关系隶属于第一关系数据库中的哪个关系标签;从所述第一关系数据库中滤除预测准确率大于阈值的各关系标签,以确定第二关系数据库;根据所述第二关系数据库,确定待处理图片中各物体的关系。
在一些实施例中,还包括:对图像样本进行目标检测,以确定所述图像样本中所述各物体的描述标签和位置信息;所述利用机器学习模型预测所述各物体之间的关系隶属于第一关系数据库中的哪个关系标签包括:根据所述描述标签和所述位置信息,利用所述机器学习模型进行预测。
在一些实施例中,所述位置信息包括所述图像样本中各物体的绝对位置信息或相对位置信息中的至少一个。
在一些实施例中,所述绝对位置信息包括所述图像样本中主体物体的位置坐标、客体物体的位置坐标,所述相对位置信息包括所述主体物体与所述客体物体之间的位置差异。
在一些实施例中,所述利用机器学习模型预测所述各物体之间的关系隶属于第一关系数据库中的哪个关系标签包括:根据获取的所述描述标签的词向量,利用机器学习模型进行预测。
在一些实施例中,所述第一关系数据库中的各关系标签经过了聚类合并处理,以滤除语义重复的关系标签。
在一些实施例中,所述的图像处理方法,还包括:根据所述待处理图片中各物体的关系,利用机器学习方法确定所述待处理图片的描述。
在一些实施例中,所述的图像处理方法,还包括:根据所述待处理图片中各物体的关系和用户的相关提问,利用机器学习方法确定相应的答复。
根据本公开的另一些实施例,提供一种图像处理装置,包括:预测单元,用于根据各物体的描述标签,利用机器学习模型预测所述各物体之间的关系隶属于第一关系数据库中的哪个关系标签;滤除单元,用于从所述第一关系数据库中滤除预测准确率大于阈值的各关系标签,以确定第二关系数据库;确定单元,用于根据所述第二关系数据库,确定待处理图片中各物体的关系。
根据本公开的又一些实施例,提供一种图像处理装置,包括:存储器;和耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行上述任一个实施例中的图像处理方法。
根据本公开的再一些实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的图像处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910698145.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:残留回声消除方法和装置
- 下一篇:通过进程内操作系统的扩展应用机制
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序