相关文章推荐
含蓄的罐头  ·  Sort a list of ...·  1 年前    · 
老实的刺猬  ·  SQL Server - ...·  1 年前    · 
CVPR 2023 | YOSO:第一个实时全景分割网络

CVPR 2023 | YOSO:第一个实时全景分割网络

一句话总结

YOSO:第一个实时全景分割框架,在COCO上达到46.4 PQ / 45.6 FPS;在Cityscapes上达到52.5 PQ / 22.6 FPS代码刚刚开源!

点击进入—> 图像分割微信技术交流群

想看更多CVPR 2023论文和 开源项目 可以点击:

YOSO

You Only Segment Once: Towards Real-Time Panoptic Segmentation

单位:厦门大学(曹刘娟团队)

代码: github.com/hujiecpp/YOS

论文下载链接(PDF已上传至星球,可一键下载): arxiv.org/abs/2303.1465

YOSO通过全景kernel和图像特征图之间的动态卷积来预测掩码,在这种情况下,实例和语义分割任务只需要分割一次。

为了减少计算开销,我们设计了一个用于特征图提取的特征金字塔聚合器,以及一个用于全景kernel生成的可分离动态解码器。

聚合器以卷积优先的方式重新参数化插值优先模块,这显著加快了pipeline的速度,而没有任何额外的成本。解码器通过可分离的动态卷积执行多头交叉注意力,以获得更好的效率和准确性。

算法细节

实验结果

据我们所知,YOSO是第一个实时全景分割框架,与最先进的模型相比,它提供了有竞争力的性能。具体而言,YOSO 达到46.4 PQ, 45.6 FPS on COCO; 52.5 PQ, 22.6 FPS on Cityscapes; 38.0 PQ, 35.4 FPS on ADE20K; and 34.1 PQ, 7.1 FPS on Mapillary Vistas。

点击进入—> 图像分割微信技术交流群

推荐阅读

CVPR 2023 | 中科大提出SimpleNet:用于图像异常检测和定位的简单网络

CVPR 2023 | CIM:用于自监督视觉预训练的相关图像建模

CVPR 2023 | VoxelNeXt:用于3D目标检测和跟踪的全稀疏VoxelNet

CVPR 2023 | OmniTracker:通过跟踪和检测来统一目标跟踪

CVPR 2023 | 检测开放世界中的一切:面向通用目标检测

CVPR 2023 | DRSformer:用于有效图像去雨的稀疏Transformer网络

CVPR 2023 | 大连理工提出ViPT:视觉Prompt多模态跟踪

CVPR 2023 | 香港理工提出SIM:用于框监督实例分割的语义感知实例掩码生成

CVPR 2023 | 清华&阿里提出BEVHeight:基于视觉的路边3D目标检测框架

送RTX 4090!黄仁勋对话ChatGPT背后的英雄,GTC 2023 AI大会来了!

CVPR 2023 | LoGoNet:局部到全局交叉模态融合实现3D目标检测

CVPR 2023 | FasterNet:追求更高的FLOPS以实现更快的神经网络

Visual ChatGPT:用视觉基础模型进行对话、绘图和编辑

CVPR 2023 | GRL:用于图像恢复的图像层次结构的高效显式建模

CVPR 2023 | 涨点显著!CutLER:用于无监督目标检测和实例分割的切割和学习

CVPR 2023 | 华科&优图提出TCM:将CLIP模型转换为场景文本检测器

CVPR 2023 | 把扩散模型应用到3D医学图像重建!DiffusionMBIR:使用预训练2D扩散模型求解3D逆问题

发布于 2023-03-29 20:35 ・IP 属地上海

文章被以下专栏收录