CVPR 2023 | YOSO：第一个实时全景分割网络

CVer计算机视觉

一句话总结

YOSO：第一个实时全景分割框架，在COCO上达到46.4 PQ / 45.6 FPS；在Cityscapes上达到52.5 PQ / 22.6 FPS代码刚刚开源！

想看更多CVPR 2023论文和开源项目可以点击：

YOSO

You Only Segment Once: Towards Real-Time Panoptic Segmentation

单位：厦门大学（曹刘娟团队）

代码： https:// github.com/hujiecpp/YOS O

论文下载链接（PDF已上传至星球，可一键下载）： https:// arxiv.org/abs/2303.1465 1

YOSO通过全景kernel和图像特征图之间的动态卷积来预测掩码，在这种情况下，实例和语义分割任务只需要分割一次。

为了减少计算开销，我们设计了一个用于特征图提取的特征金字塔聚合器，以及一个用于全景kernel生成的可分离动态解码器。

聚合器以卷积优先的方式重新参数化插值优先模块，这显著加快了pipeline的速度，而没有任何额外的成本。解码器通过可分离的动态卷积执行多头交叉注意力，以获得更好的效率和准确性。

算法细节

实验结果

据我们所知，YOSO是第一个实时全景分割框架，与最先进的模型相比，它提供了有竞争力的性能。具体而言，YOSO 达到46.4 PQ, 45.6 FPS on COCO; 52.5 PQ, 22.6 FPS on Cityscapes; 38.0 PQ, 35.4 FPS on ADE20K; and 34.1 PQ, 7.1 FPS on Mapillary Vistas。

点击进入—> 图像分割微信技术交流群

推荐阅读

CVPR 2023 | 中科大提出SimpleNet：用于图像异常检测和定位的简单网络

CVPR 2023 | CIM：用于自监督视觉预训练的相关图像建模

CVPR 2023 | VoxelNeXt：用于3D目标检测和跟踪的全稀疏VoxelNet

CVPR 2023 | OmniTracker：通过跟踪和检测来统一目标跟踪

CVPR 2023 | 检测开放世界中的一切：面向通用目标检测

CVPR 2023 | DRSformer：用于有效图像去雨的稀疏Transformer网络

CVPR 2023 | 大连理工提出ViPT：视觉Prompt多模态跟踪

CVPR 2023 | 香港理工提出SIM：用于框监督实例分割的语义感知实例掩码生成

CVPR 2023 | 清华&阿里提出BEVHeight：基于视觉的路边3D目标检测框架

送RTX 4090！黄仁勋对话ChatGPT背后的英雄，GTC 2023 AI大会来了！

CVPR 2023 | LoGoNet：局部到全局交叉模态融合实现3D目标检测

CVPR 2023 | FasterNet：追求更高的FLOPS以实现更快的神经网络

Visual ChatGPT：用视觉基础模型进行对话、绘图和编辑

CVPR 2023 | GRL：用于图像恢复的图像层次结构的高效显式建模

CVPR 2023 | 涨点显著！CutLER：用于无监督目标检测和实例分割的切割和学习

CVPR 2023 | 华科&优图提出TCM：将CLIP模型转换为场景文本检测器

CVPR 2023 | 把扩散模型应用到3D医学图像重建！DiffusionMBIR：使用预训练2D扩散模型求解3D逆问题

发布于 2023-03-29 20:35 ・IP 属地上海

CVPR2023

计算机视觉

全景分割

一句话总结

YOSO

算法细节

实验结果

推荐阅读

文章被以下专栏收录

CVer计算机视觉