3、论文阅读:EnYOLO:一种基于图像增强的水下目标区域自适应实时检测框架

图像增强和目标检测的结合

  • 前言
  • 介绍
  • 相关工作
    • UIE 水下图像增强
    • UOD 水下目标检测
    • UDA 水下域自适应
  • 方法介绍
    • 训练过程
    • 推理过程
    • 网络概述
    • 多阶段训练策略
      • Burn-In Stage(预热阶段)
      • Mutual-Learning Stage(相互学习阶段)
      • Domain-Adaptation Stage(领域适应阶段)
    • 多阶段训练策略算法介绍
    • 损失设计
      • Burn-In Stage
      • Mutual-Learning Stage
      • Domain-Adaptation Stage
  • 实验
    • 实验的细节
      • 数据集
      • 训练设置
    • 水下图像增强实验
    • 水下目标检测实验
  • 结论
  • 代码

前言

UIE:水下图像增强
UOD:水下目标检测
AUVS:自主水下航行器
水下图像增强在水下目标检测任务方面应用不多,具体有一下原因:
(1)使用UIE作为预处理步骤,引入了很大的计算量
(2)在目标检测之前进行图像增强未必能够产生性能改进
(3)复杂的水下环境导致不同场景下的域偏移,严重影响UOD性能
为了解决这些挑战,我们引入了EnYOLO,这是一种集成的实时框架,设计用于同时进行UIE和UOD,并具有域适应能力。具体地说,UIE和UOD任务头共享相同的网络主干,并利用轻量级设计。
此外,我们提出一种新颖的领域适应性策略,以对齐来自不同水下环境的特征嵌入

介绍

复杂的水下环境导致水下图像的质量很差,因此,用UIE方法获取清晰的水下图像通常被认为是与视觉相关的水下任务的必要前提。为此,引入了EnYOLO:基于领域自适应的实时UIE和UOD集成框架。UIE和UOD任务负责人都利用相同的网络主干,并采用轻量级架构。此外,我们引入了一种多阶段的训练方法,以保持训练这两个任务的平衡,其总体目标是不断提高其性能。另外,我们还提出一种新的领域自适应方法来减轻水下各种环境的域差距

相关工作

UIE 水下图像增强

传统的方法通过在一定的先验假设下估计后向散射和透射,可以得到清晰的图像,它们的功效在复杂的现实世界场景中可能会下降。
相比之下,基于学习的方法直接获得从退化的水下图像到其清晰对应物的映射,在复杂情况下表现出更好的适应性。

UOD 水下目标检测

通常在水下目标检测之前先进行水下图像增强,但是会引入大量的计算,同时,增强图像中潜在伪影的存在也会导致某些环境中检测性能的下降、

UDA 水下域自适应

通过减轻不同领域之间的特征分布变化,领域自适应技术已经在各种各样的任务中进行了研究。在水下视觉任务的背景下,UIE主要讨论了领域自适应。目前的技术主要局限于UIE领域,对UOD领域适应性的探索有限。本研究中,我们提出了一种简单而有效的领域调适策略,以利用UIE所衍生的增强型特征嵌入。

方法介绍

我们提出的框架旨在同时有效地启用UIE和UOD。
我们使用成对的合成水下数据集Dps={(xs, ˆxs)i, i ∈ [1, ns]}来促进UIE任务的训练。ns表示数据集的大小。xs表示退化的合成水下图像,而 ˆxs是对应的清晰图像
对于UOD任务的训练,我们利用带标签的真实世界水下数据集Dlr ={(xr, br, cr)i, i ∈ [1, nr]};;其中nr表示真实世界数据集大小,xr表示真实世界水下图像,br表示边界框注释,cr是类标签。此外,Dlr中的真实水下图像即xr还构成了不成对的真实水下数据集Dur = {(xr)i,i ∈ [1,nr]},以增强UIE模块在真实世界场景中的性能。此外,UIE针对每个xr的增强结果ˆxr,连同他们对应的br和cr,用公式表示标记的增强现实世界数据集Dle = {( ˜xr, br, cr)i, i ∈ [1, nr]},也用于训练UOD任务。
在推理过程中,网络获取真实水下图像xr,并随后预测增强的图像ˆxr和检测结果(˜br, ˜cr)<

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/881883.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JavaEE: 创造无限连接——网络编程中的套接字

文章目录 Socket套接字TCP和UDP的区别有连接/无连接可靠传输/不可靠传输面向字节流/面向数据报全双工/半双工 UDP/TCP api的使用UDPDatagramSocketDatagramPacketInetSocketAddress练习 TCPServerSocketSocket练习 Socket套接字 Socket是计算机网络中的一种通信机制&#xff0…

代码随想录算法训练营第五十八天 | 拓扑排序精讲-软件构建

目录 软件构建 思路 拓扑排序的背景 拓扑排序的思路 模拟过程 判断有环 写代码 方法一&#xff1a; 拓扑排序 软件构建 题目链接&#xff1a;卡码网&#xff1a;117. 软件构建 文章讲解&#xff1a;代码随想录 某个大型软件项目的构建系统拥有 N 个文件&#xff0c;文…

机器人的动力学——牛顿欧拉,拉格朗日,凯恩

机器人的动力学推导方法有很多&#xff0c;常用得有牛顿&#xff0c;拉格朗日&#xff0c;凯恩等方法&#xff0c;接下来&#xff0c;简单说说他们之间的使用。注&#xff1a;这里不考虑怎么来的&#xff0c;只说怎么应用。 参考1&#xff1a;4-14动力学分析方法-牛顿—欧拉方…

聚焦API安全未来,F5打造无缝集成的解决方案

研究发现&#xff0c;目前超过90%的基于Web的网络攻击都以API端点为目标。随着对API使用需求的增加&#xff0c;这些攻击还会持续增长。现代企业需要一种动态防御策略&#xff0c;在风险升级成代价高昂、令人警惕且往往无法预防的API安全漏洞之前&#xff0c;发现并降低风险。 …

数据库提权【笔记总结】

文章目录 UDF提权以有webshell只有数据库权限条件复现msf工具sql语句提权 MOF提权前言条件复现msf工具php脚本提权 sqlserver提权前言条件xp_cmdshell提权复现 沙盒提权介绍复现 Oracle提权靶场搭建执行任意命令复现 通过注入存储过程提权&#xff08;低权限提升至DBA&#xff…

C++从入门到起飞之——多态 全方位剖析!

&#x1f308;个人主页&#xff1a;秋风起&#xff0c;再归来~&#x1f525;系列专栏&#xff1a;C从入门到起飞 &#x1f516;克心守己&#xff0c;律己则安 目录 1. 多态的概念 2. 多态的定义及实现 2.1 多态的构成条件 2.1.1 实现多态还有两个必须重要条件&…

群晖NAS使用Docker本地部署网页版Ubuntu系统并实现无公网IP远程访问

文章目录 前言1. 下载Docker-Webtop镜像2. 运行Docker-Webtop镜像3. 本地访问网页版Linux系统4. 群晖NAS安装Cpolar工具5. 配置异地访问Linux系统6. 异地远程访问Linux系统7. 固定异地访问的公网地址 前言 本文旨在详细介绍如何在群晖NAS部署docker-webtop&#xff0c;并结合c…

通用接口开放平台设计与实现——(31)API服务线程安全问题确认与修复

背景 在本系列的前面一篇博客评论中&#xff0c;有小伙伴指出&#xff0c;API服务存在线程安全问题&#xff1a; https://blog.csdn.net/seawaving/article/details/122905199#comments_34477405 今天来确认下&#xff0c;线程是否安全&#xff1f;如不安全&#xff0c;如何…

高配小主机加装SSD固态硬盘,我选择性能与设计兼备的希捷酷鱼 530

高配小主机加装SSD固态硬盘&#xff0c;我选择性能与设计兼备的希捷酷鱼 530 哈喽小伙伴们好&#xff0c;我是Stark-C~ 我最近入手了零刻的一款新发布的 GTi12 Ultra高性能迷你主机&#xff0c;其出色的配置与强大的功能让我有了将它用作主力机的打算。不过因为它的高配版本搭…

【记录一下VMware上开虚拟端口映射到公网】

材料 win11 和装在vmware上的ubuntu 步骤一在Ubuntu上配置静态地址&#xff0c;配置如下 vim /etc/netplan/01-network-manager-all.yaml(此文件看系统上对应的是哪个文件&#xff0c;建议先备份)network:version: 2renderer: NetworkManagerethernets:ens33:dhcp4: falseadd…

四十一、完成内容添加功能(使用go测试方法)

目录 一、添加model 二、完成相关dao 三、使用测试类进行测试 1、把光标防止要测试的方法上&#xff0c;右击并选择 2、自动会生成一个以dao文件加_test命名的文件 3、在其中完善方法并完成测试 四、完成content_create_handle 一、添加model 按数据库字段以及字段格式完…

Android 如何实现搜索功能:本地搜索?数据模型如何设计?数据如何展示和保存?

目录 效果图为什么需要搜索功能如何设计搜索本地的功能&#xff0c;如何维护呢&#xff1f;总结 一、效果图 二、为什么需要搜索功能 找一个选项&#xff0c;需要花非常多的时间&#xff0c;并且每次都需要指导客户在哪里&#xff0c;现在只要让他们搜索一下就可以。这也是模…

基于SpringBoot+Vue的剧本杀管理系统

作者&#xff1a;计算机学姐 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等&#xff0c;“文末源码”。 专栏推荐&#xff1a;前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于JavaSpringBootVueMySQL的…

AIGC7: 高通骁龙AIPC开发者沙龙过程记录A

图中是一座高耸的宫殿。 就像AI的出现&#xff0c;慢慢初现端倪&#xff0c;头角峥嵘。 背景 一直以来都比较关注AI的发展&#xff0c;有幸再一次参加异常AI的盛会。 从我的角度看。 高通是一家生产芯片的公司&#xff0c;国内的小米&#xff0c;荣耀&#xff0c;Oppo , Vi…

华为为什么要做三折叠屏手机?

前些天我做了一条视频&#xff0c;关于讲华W的新的三折叠屏手机。我说我有点失望&#xff0c;结果引起了华W的同事的一些关注。于是&#xff0c;华W几位高管都跑过来&#xff0c;跟我解释为什么会出现这样的一个状态。 我才知道&#xff0c;这款手机他们其实是亏着钱在卖的。因…

【测试】——Selenium API (万字详解)

&#x1f4d6; 前言&#xff1a;本文详细介绍了如何利用Selenium进行Web自动化测试&#xff0c;包括定位元素&#xff08;如cssSelector和xpath&#xff09;、常用操作函数&#xff08;如点击、输入等&#xff09;、窗口管理、键盘鼠标事件和浏览器导航&#xff0c;以及处理弹窗…

图说GPT网络结构(参数量与计算量估计)

现在AI领域的主流模型几乎都是Transformer网络架构衍生而来。大热的LLM中的生成类模型很多都是来自于Transformer的变体&#xff0c;即decoder only架构。而GPT就是该类中的经典模型。尽管现在变体甚多&#xff0c;但大多没有根本性地改变其套路。 为了阐述方便&#xff0c;首…

音视频入门基础:AAC专题(8)——FFmpeg源码中计算AAC裸流AVStream的time_base的实现

音视频入门基础&#xff1a;AAC专题系列文章&#xff1a; 音视频入门基础&#xff1a;AAC专题&#xff08;1&#xff09;——AAC官方文档下载 音视频入门基础&#xff1a;AAC专题&#xff08;2&#xff09;——使用FFmpeg命令生成AAC裸流文件 音视频入门基础&#xff1a;AAC…

数据安全治理

数据安全治理 1.数据安全治理2.终端数据安全加密类权限控制类终端DLP类桌面虚拟化安全桌面 3.网络数据安全4.存储数据安全5.应用数据安全6.其他话题数据脱敏水印与溯源 7.UEBA8.CASB 1.数据安全治理 数据安全治理最为重要的是进行数据安全策略和流程制订。在企业或行业内经常发…

[大语言模型-论文精读] 以《黑神话:悟空》为研究案例探讨VLMs能否玩动作角色扮演游戏?

1. 论文简介 论文《Can VLMs Play Action Role-Playing Games? Take Black Myth Wukong as a Study Case》是阿里巴巴集团的Peng Chen、Pi Bu、Jun Song和Yuan Gao&#xff0c;在2024.09.19提交到arXiv上的研究论文。 论文: https://arxiv.org/abs/2409.12889代码和数据: h…