CVPR 2023 | YOSO:第一个实时全景分割网络
一句话总结
YOSO:第一个实时全景分割框架,在COCO上达到46.4 PQ / 45.6 FPS;在Cityscapes上达到52.5 PQ / 22.6 FPS代码刚刚开源!
点击进入—> 图像分割微信技术交流群
想看更多CVPR 2023论文和 开源项目 可以点击:
YOSO
You Only Segment Once: Towards Real-Time Panoptic Segmentation
单位:厦门大学(曹刘娟团队)
代码: https:// github.com/hujiecpp/YOS O
论文下载链接(PDF已上传至星球,可一键下载): https:// arxiv.org/abs/2303.1465 1
YOSO通过全景kernel和图像特征图之间的动态卷积来预测掩码,在这种情况下,实例和语义分割任务只需要分割一次。
为了减少计算开销,我们设计了一个用于特征图提取的特征金字塔聚合器,以及一个用于全景kernel生成的可分离动态解码器。
聚合器以卷积优先的方式重新参数化插值优先模块,这显著加快了pipeline的速度,而没有任何额外的成本。解码器通过可分离的动态卷积执行多头交叉注意力,以获得更好的效率和准确性。
算法细节
实验结果
据我们所知,YOSO是第一个实时全景分割框架,与最先进的模型相比,它提供了有竞争力的性能。具体而言,YOSO 达到46.4 PQ, 45.6 FPS on COCO; 52.5 PQ, 22.6 FPS on Cityscapes; 38.0 PQ, 35.4 FPS on ADE20K; and 34.1 PQ, 7.1 FPS on Mapillary Vistas。
点击进入—> 图像分割微信技术交流群
推荐阅读
CVPR 2023 | 中科大提出SimpleNet:用于图像异常检测和定位的简单网络
CVPR 2023 | CIM:用于自监督视觉预训练的相关图像建模
CVPR 2023 | VoxelNeXt:用于3D目标检测和跟踪的全稀疏VoxelNet
CVPR 2023 | OmniTracker:通过跟踪和检测来统一目标跟踪
CVPR 2023 | 检测开放世界中的一切:面向通用目标检测
CVPR 2023 | DRSformer:用于有效图像去雨的稀疏Transformer网络
CVPR 2023 | 大连理工提出ViPT:视觉Prompt多模态跟踪
CVPR 2023 | 香港理工提出SIM:用于框监督实例分割的语义感知实例掩码生成
CVPR 2023 | 清华&阿里提出BEVHeight:基于视觉的路边3D目标检测框架
送RTX 4090!黄仁勋对话ChatGPT背后的英雄,GTC 2023 AI大会来了!
CVPR 2023 | LoGoNet:局部到全局交叉模态融合实现3D目标检测
CVPR 2023 | FasterNet:追求更高的FLOPS以实现更快的神经网络
Visual ChatGPT:用视觉基础模型进行对话、绘图和编辑
CVPR 2023 | GRL:用于图像恢复的图像层次结构的高效显式建模
CVPR 2023 | 涨点显著!CutLER:用于无监督目标检测和实例分割的切割和学习
CVPR 2023 | 华科&优图提出TCM:将CLIP模型转换为场景文本检测器
CVPR 2023 | 把扩散模型应用到3D医学图像重建!DiffusionMBIR:使用预训练2D扩散模型求解3D逆问题