[发明专利]图像标签的识别方法和装置在审
申请号: | 202011004911.3 | 申请日: | 2020-09-22 |
公开(公告)号: | CN114255363A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 许静;张磊;刘超;张奇;迟颖 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;张文华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标签 识别 方法 装置 | ||
本发明公开了一种图像标签的识别方法和装置。其中,该方法包括:使用图像标签识别模型对目标图像进行识别,得到第一识别结果,其中,图像标签识别模型为使用多组数据通过机器学习训练出的,多组数据中的数据包括:图像和图像中包括的图像标签对应的数值;将第一识别结果中的数值转换到预设数值区间,得到第二识别结果,其中,第一识别结果中包括至少一个数值,所述数值与图像标签相对应;根据第二识别结果,确定目标图像的图像标签。本发明解决了识别图像标签的准确率低的技术问题。
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种图像标签的识别方法和装置。
背景技术
近年来,随着计算机辅助诊断的迅速发展,医学影像技术已成为临床诊断的重要依据,医学图像的筛选和汇总通常由经验丰富的医学专业人员进行,从庞大的医学图像数据集中获取重要信息是一项耗时且费力的任务。
在医学图像标签识别任务中,现有技术中多以图像数据集为基础进行大规模图像的单标签概念识别,或者以小规模医学图像为基础进行少量多标签概念识别。在模型构建方法上多以某个卷积神经网络来提取视觉信息,通过多种附加方法学习医学图像,或者采用较深的卷积神经模型。还有一些方案采取结合卷积神经网络和循环神经网络,利用编码器到解码器的结构的方式,生成与医学图像对应的概念集合。然而,这些更深的网络模型并未带来明显的改善,结合卷积神经网络和循环神经网络方案的效果也高度依赖于同一幅图像中多个概念的相关性,对关联度较高的标签识别结果较好,但对低量级的标签识别准确率较低,容易受到噪声标签的干扰。
针对现有技术中图像标签识别准确率较低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种图像标签的识别方法和装置,以至少解决识别图像标签的准确率低的技术问题。
为了实现上述目的,根据本申请的一个方面,提供了一种图像标签的识别方法。该方法包括:使用图像标签识别模型对目标图像进行识别,得到第一识别结果,其中,所述图像标签识别模型为使用多组数据通过机器学习训练出的,所述多组数据中的数据包括:图像和图像中包括的图像标签对应的数值;将所述第一识别结果中的数值转换到预设数值区间,得到第二识别结果,其中,所述第一识别结果中包括至少一个数值,所述数值与图像标签相对应;根据所述第二识别结果,确定所述目标图像的图像标签。
进一步地,在使用图像标签识别模型对待识别图像集合中每个图像进行处理之前,所述方法还包括:将图像样本集合中的图像标签进行低频滤除处理,得到第一图像标签集合;对所述第一图像标签集合中的图像标签进行关联性处理,得到第二图像标签集合;根据所述第二图像标签集合确定所述图像样本集合中的图像包括的图像标签,得到第三图像标签集合,其中,所述第三图像标签集合由至少一个子集组成,所述子集与所述图像样本集合中的图像相对应;根据所述第三图像标签集合和所述图像样本集合进行学习训练,生成图像标签识别模型。
进一步地,在将图像样本集合中的图像标签进行低频滤除处理之前,所述方法包括:获取验证图像集合中的所有图像标签,得到验证集图像标签集合;确定所述验证集图像标签集合中未在所述图像样本集合的图像标签出现的图像标签,得到待扩充图像标签子集;根据所述待扩充图像标签子集对所述图像样本集合的图像标签和所述图像样本集合进行扩充处理,得到扩充处理后的所述图像样本集合的图像标签和所述图像样本集合。
进一步地,根据所述待扩充图像标签子集对所述图像样本集合的图像标签和所述图像样本集合进行扩充处理包括:根据所述待扩充图像标签子集确定待扩充图像;对所述待扩充图像进行随机变换处理;将变换处理后的所述待扩充图像添加到所述图像样本集合中。
进一步地,将图像样本集合中的图像标签进行低频滤除处理包括:统计所述图像样本集合的图像标签在所述图像样本集合中出现的次数;将所述次数低于第一预设阈值的图像标签从所述图像样本集合的图像标签中滤除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011004911.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于换流阀的支撑式升降灭火系统
- 下一篇:权限处理方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序