[发明专利]一种基于改进的生成对抗网络的水下图像翻译方法有效
申请号: | 202110930109.5 | 申请日: | 2021-08-13 |
公开(公告)号: | CN113537401B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 孙玉山;周天;张国成;王旭;张家利;张力文;刘继骁;祁彧 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都方圆聿联专利代理事务所(普通合伙) 51241 | 代理人: | 邓永红 |
地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 生成 对抗 网络 水下 图像 翻译 方法 | ||
本发明公开了一种基于改进的生成对抗网络的水下图像翻译方法,包括以下步骤:步骤S1:针对具体的检测任务,制作目标模型,将其放在空气中进行空气中目标数据集的采取,得到空气中数据集;步骤S2:在已公开的各个水下数据集中制作不同水域的水下数据集;步骤S3:根据空气中数据集以及不同水域的水下数据集构建改进的DRIT生成对抗网络;步骤S4:训练对抗网络参数;步骤S5:将空气目标图片与水下风格图片放进对抗网络,得到具有水下风格的目标图片;本发明将空气中的目标图像翻译成水下风格的图像,以此来节省时间与经济制作水下数据集。
技术领域
本发明涉及水下图像翻译领域,特别是一种基于改进的生成对抗网络的水下图像翻译方法。
背景技术
随着深度学习在水下领域的应用,水下数据集的需求越来越大,但由于水下设备的有限性以及经济因素(水下摄像头要搭载水下机器人等设备来进行图片采集),水下数据集的获取及扩展显得尤为迫切。
近些年,图像翻译技术风靡于各领域(例如,灰度到颜色,图像到语义标签,边缘地图到照片,陆地风格图像到水下风格图像),将图像翻译技术应用于水下数据集拓展是一个可行的方法,对于图像翻译,目前,有两大主流的研究方向:
1.在成对数据的监督环境下的图像翻译技术(Image-to-Image Translationwith Conditional Adversarial Networks(pix2pix));
2.非成对数据的无监督图像翻译(Unpaired Image-to-Image Translationusing Cycle-Consistent Adversarial Networks(CycleGAN),Unsupervised Image-to-Image Translation Networks(UNIT),Diverse Image-to-Image Translation viaDisentangled Representations(DRIT)),在水下领域,获得与空气中相匹配的数据集是不现实的,另外,水下环境是多种多样的,对于不同的水下数据集,输入图像需要输出不同的输出图像。
发明内容
为解决现有技术中存在的问题,本发明提供了一种基于改进的生成对抗网络的水下图像翻译方法,本发明将空气中的目标图像翻译成水下风格的图像,以此来节省时间与经济制作水下数据集。
一种基于改进的生成对抗网络的水下图像翻译方法,包括以下步骤:
步骤S1:针对具体的检测任务,制作目标模型,将其放在空气中进行空气中目标数据集的采取,得到空气中数据集;
步骤S2:在已公开的各个水下数据集中制作不同水域的水下数据集;
步骤S3:根据空气中数据集以及不同水域的水下数据集构建改进的DRIT生成对抗网络;
步骤S4:训练对抗网络参数;
步骤S5:将空气目标图片与水下风格图片放进对抗网络,得到具有水下风格的目标图片。
优选地,S3包括以下子步骤:
子步骤S31:该网络训练模型是在没有成对训练数据的情况下,学习两个域X和Y之间的映射;
子步骤S32:框架包括两个内容编码器
子步骤S33:属性编码器两个生成器Gx,Gy,域判别器Dx,Dy,一个属性判别器Da,一个内容判别器Dc;
子步骤S34:内容编码器一将图像映射到内容空间属性编码器一将图像映射到的属性空间
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110930109.5/2.html,转载请声明来源钻瓜专利网。