AI/CV重磅干货,第一时间送达

点击进入—> 【计算机视觉】微信技术交流群

2023 年 2 月 28 日凌晨, CVPR 2023 顶会论文接收结果出炉! 这次没有先放出论文 ID List,而是直接 email 通知作者(朋友圈好友纷纷晒截图,报喜讯~你被刷屏了没?!)。

CVPR 2023 主委会官方发布这次论文接收数据: 有效投稿 9155 篇 (比 CVPR 2022 增加12%), 收录 2360 篇 (CVPR 2016 投稿才 2145 篇),接收率为 25.78 %

CVPR 2023 会议将于 2023 年 6 月 18 日至 22 日在加拿大温哥华(Vancouver) 举行。这次线下参加人数一定会比去年多很多,因为 将会有一大波国内的学者线下参加学术交流 (公费旅游bushi)。

Amusi 简单预测一下,CVPR 2023 收录的工作中 " 扩散模型、多模态、预训练、MAE " 相关工作的数量会显著增长。

本文快速整理了10篇 CVPR 2023 最新工作,内容如下所示。如果你想持续了解更多更新的CVPR 2023 论文和代码,大家可以关注 CVPR2023-Papers-with-Code, 在CVer公众号后台回复: CVPR2023 ,即可下载,链接如下:

https://github.com/amusi/CVPR2023-Papers-with-Code

这个项目是从2020年开始,累计提交了600+次!Star数已经破万+!覆盖CVPR 2020-2023的论文工作,很开心能帮助到一些同学。

如果你的 CVPR 2023 论文接收了,欢迎提交issues~

Backbone

1. Integrally Pre-Trained Transformer Pyramid Networks

  • 单位:国科大, 华为, 鹏城实验室

  • Paper: https://arxiv.org/abs/2211.12735

  • Code: https://github.com/sunsmarterjie/iTPN

本文提出整体预训练的ViT金字塔网络(iTPN):通过整体预训练主干和金字塔网络缩小上游预训练和微调的gap,表现SOTA!性能优于CAE、ConvMAE等网络,代码已开源!

2. Stitchable Neural Networks

  • 单位:蒙纳士大学ZIP Lab

  • Homepage: https://snnet.github.io/

  • Paper: https://arxiv.org/abs/2302.06586

  • Code: https://github.com/ziplab/SN-Net

Stitchable 神经网络(SN-Net):一种用于模型部署的新的可扩展和高效的框架,它可以快速地生成具有不同复杂性和性能权衡的大量网络,促进了现实世界应用的深度模型的大规模部署,代码即将开源!

3. Learning 3D Representations from 2D Pre-trained Models via Image-to-Point Masked Autoencoders

  • 单位:上海AI Lab, 港中大MMLab, 北大

  • Paper: https://arxiv.org/abs/2212.06785

  • Code: https://github.com/ZrrSkywalker/I2P-MAE

I2P-MAE:Image-to-Point掩码自编码器,一种从2D预训练模型中获得卓越的3D表示方法,在3D点云分类上表现SOTA(刷新ModelNet40和ScanObjectNN新记录)!性能优于P2P、PointNeXt等网络,代码即将开源!

4. NoPe-NeRF: Optimising Neural Radiance Field with No Pose Prior

  • 单位:牛津大学

  • Home: https://nope-nerf.active.vision/

  • Paper: https://arxiv.org/abs/2212.07388

  • Code: None

NoPe-NeRF:一个端到端可微模型,用于联合相机姿势估计和从图像序列中进行新颖的视图合成,在真实室内和室外场景上实验表明:此方法在新颖的视图渲染质量和姿态估计精度方面优于现有方法。

Diffusion Models(扩散模型)

5. Video Probabilistic Diffusion Models in Projected Latent Space

  • 单位:KAIST, 谷歌

  • Homepage: https://sihyun.me/PVDM/

  • Paper: https://arxiv.org/abs/2302.07685

  • Code: https://github.com/sihyun-yu/PVDM

据称PVDM:是第一个用于视频合成的latent扩散模型,它学习低维隐空间中的视频分布,可以在有限资源下使用高分辨率视频进行有效训练,以使用单个模型合成任意长度的视频,代码刚刚开源!单位:KAIST, 谷歌

6. Solving 3D Inverse Problems using Pre-trained 2D Diffusion Models

  • 单位:KAIST, 洛斯阿拉莫斯国家实验室

  • Paper: https://arxiv.org/abs/2211.10655

  • Code: None

本文提出DiffusionMBIR:一种用于3D医学图像重建的扩散模型重建策略,实验证明:其能够实现稀疏视图CT、有限角度CT和压缩感知MRI的最先进重建。

视觉和语言(Vision-Language)

7. GIVL: Improving Geographical Inclusivity of Vision-Language Models with Pre-Training Methods

  • 单位:UCLA, 亚马逊Alexa AI

  • Paper: https://arxiv.org/abs/2301.01893

  • Code: None

本文提出GIVL:一种地理包容性视觉和语言预训练模型,在地理多样化的V&L任务上实现了最先进的和更均衡的性能。

目标检测(Object Detection)

8. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

  • 单位:YOLOv4 原班人马

  • Paper: https://arxiv.org/abs/2207.02696

  • Code: https://github.com/WongKinYiu/yolov7

超越YOLOv5、YOLOX、PPYOLOE、YOLOR等目标检测网络!

9. DETRs with Hybrid Matching

  • 单位:北大, 中科大, 浙大, MSRA

  • Paper: https://arxiv.org/abs/2207.13080

  • Code: https://github.com/HDETR

本文提出一种非常简单且有效的混合匹配方案,以解决基于 DETR 的方法在多种视觉任务(2D/3D目标检测、姿态估计等)上的低训练效率,并提高准确性,如助力PETRv2、TransTrack和可变形DETR等网络性能提升,代码已开源!

10. Enhanced Training of Query-Based Object Detection via Selective Query Recollection

  • 单位:CMU, Meta AI

  • Paper: https://arxiv.org/abs/2212.07593

  • Code: https://github.com/Fangyi-Chen/SQR

即插即用!本文提出选择性查询回忆(SQR):一种基于查询的目标检测器训练新策略,可以很容易地插入到各种DETR变体中,显著提高它们的性能,代码已开源!

点击进入—> 【计算机视觉】微信技术交流群

最新CVPP 2023论文和代码下载

后台回复: CVPR2023, 即可下载CVPR 2023论文和代码开源的论文合集

后台回复: Transformer综述, 即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer333,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!
▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
2023 年 2 月 28 日凌晨, CVPR 2023 顶会 论文 接收 结果 出炉 CVPR 2023 收录的工作中 " 扩散模型、多模态、预训练、MAE " 相关工作的数量会显著增长。 整理:AI算法与图像处理 CVPR 2023 论文 和代码整理:https://github.com/DWCTOD/ CVPR 2023 -Papers-with-Code-Demo欢迎关注公众号 AI算法与图像处理,获取更多干货:大家好,最近正在优化每周分享的 CVPR 论文 , 目前考虑按照不同类别去分类,方便不同方向的小伙伴挑选自己感兴趣的 论文 哈大家好,目前给每天的 论文 汇总接入chatGPT帮忙总结,目前在... 近日, CVPR 2023 论文 接收 结果 出炉 。近年来, CVPR 的投稿数量持续增加,今年收到有效投稿 9155 ,和 CVPR 2022 相比增加 12%,创 历史 新高 。最终,大会收录 论文 2360 接收 率为 25.78 %。本次,旷视研究院有 13 论文 入选,涵盖3D 目标检测、多目标跟踪、模型压缩、知识蒸馏等多个领域。以下为入选 论文 简介 :????01VoxelNeXt:Fully Sparse... 作者|小书童 编辑| 集智书童点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【全栈算法】技术交流群为了设计快速神经网络,许多工作都集中在减少浮点运算(FLOPs)的数量上。然而,作者观察到FLOPs的这种减少不一定会带来延迟的类似程度的减少。这主要源于每秒低浮点运算(FLOPS)效率低下。为了实现更快的网络,作者重新回顾了FLOPs的运算符,并证明... CVPR 2023 顶会 论文 接收 结果 出炉 啦! CVPR 2023 主委会官方发布这次 论文 接收 数据:有效投稿 9155 (比 CVPR 2022 增加12%),收录 2360 接收 率为25.78 %。我整理了 CVPR 2023 论文 &代码,分享给大家~持续更新中…扫码添加我领取资料此外,还有AAAI 2023 论文 &代码,分享给大家~收持续更新中…扫码添加我领取资料最后,我... 来自:圆圆的算法笔记进NLP群—>加入NLP交流群 论文 标题:LexLIP: Lexicon-Bottlenecked Language-Image Pre-Training for Large-Scale Image-Text Retrieval下载地址:https://arxiv.org/abs/2302.02908根据一张图片检索相关文本,或者根据一段文本检索相关图片,在现在的工业界中越... 80、半监督学习、弱监督学习/无监督学习/自监督学习。36、行为识别/动作识别/检测/分割/定位。46、场景重建/视图合成/新视角合成。74、迁移学习/domain/自适应。23、图像复原/图像增强/图像重建。26、图像去噪/去模糊/去雨去雾。32、人脸生成/合成/重建/编辑。35、图像&视频检索/视频理解。41、GAN/生成式/对抗式。68、小样本学习/零样本学习。40、文本检测/识别/理解。17、视频生成/视频合成。27、图像编辑/图像修复。​31、人脸识别/检测。42、图像生成/图像合成。 本文提出了一种新的预训练模型架构(iTPN ),该架构由多个金字塔形的Transformer层组成。每个层都包含多个子层,其中一些是普通的self-attention和feed-forward层,而另一些则是新的pyramid层。Pyramid层是一种新的层类型,它被设计为对输入进行多粒度的表示学习。此外,iTPN 还使用了一些其他的技巧,以提高模型的鲁棒性和泛化能力。