AI/CV重磅干货,第一时间送达
点击进入—>
【计算机视觉】微信技术交流群
2023 年 2 月 28 日凌晨,
CVPR 2023 顶会论文接收结果出炉!
这次没有先放出论文 ID List,而是直接 email 通知作者(朋友圈好友纷纷晒截图,报喜讯~你被刷屏了没?!)。
CVPR 2023 主委会官方发布这次论文接收数据:
有效投稿 9155 篇
(比 CVPR 2022 增加12%),
收录 2360 篇
(CVPR 2016 投稿才 2145 篇),接收率为
25.78 %
。
CVPR 2023 会议将于
2023 年 6 月 18 日至 22 日在加拿大温哥华(Vancouver)
举行。这次线下参加人数一定会比去年多很多,因为
将会有一大波国内的学者线下参加学术交流
(公费旅游bushi)。
Amusi 简单预测一下,CVPR 2023 收录的工作中 "
扩散模型、多模态、预训练、MAE
" 相关工作的数量会显著增长。
本文快速整理了10篇 CVPR 2023 最新工作,内容如下所示。如果你想持续了解更多更新的CVPR 2023 论文和代码,大家可以关注
CVPR2023-Papers-with-Code,
在CVer公众号后台回复:
CVPR2023
,即可下载,链接如下:
https://github.com/amusi/CVPR2023-Papers-with-Code
这个项目是从2020年开始,累计提交了600+次!Star数已经破万+!覆盖CVPR 2020-2023的论文工作,很开心能帮助到一些同学。
如果你的 CVPR 2023 论文接收了,欢迎提交issues~
Backbone
1. Integrally Pre-Trained Transformer Pyramid Networks
本文提出整体预训练的ViT金字塔网络(iTPN):通过整体预训练主干和金字塔网络缩小上游预训练和微调的gap,表现SOTA!性能优于CAE、ConvMAE等网络,代码已开源!
2. Stitchable Neural Networks
-
单位:蒙纳士大学ZIP Lab
-
Homepage: https://snnet.github.io/
-
Paper: https://arxiv.org/abs/2302.06586
-
Code: https://github.com/ziplab/SN-Net
Stitchable 神经网络(SN-Net):一种用于模型部署的新的可扩展和高效的框架,它可以快速地生成具有不同复杂性和性能权衡的大量网络,促进了现实世界应用的深度模型的大规模部署,代码即将开源!
3. Learning 3D Representations from 2D Pre-trained Models via Image-to-Point Masked Autoencoders
-
单位:上海AI Lab, 港中大MMLab, 北大
-
Paper: https://arxiv.org/abs/2212.06785
-
Code: https://github.com/ZrrSkywalker/I2P-MAE
I2P-MAE:Image-to-Point掩码自编码器,一种从2D预训练模型中获得卓越的3D表示方法,在3D点云分类上表现SOTA(刷新ModelNet40和ScanObjectNN新记录)!性能优于P2P、PointNeXt等网络,代码即将开源!
4. NoPe-NeRF: Optimising Neural Radiance Field with No Pose Prior
NoPe-NeRF:一个端到端可微模型,用于联合相机姿势估计和从图像序列中进行新颖的视图合成,在真实室内和室外场景上实验表明:此方法在新颖的视图渲染质量和姿态估计精度方面优于现有方法。
Diffusion Models(扩散模型)
5. Video Probabilistic Diffusion Models in Projected Latent Space
-
单位:KAIST, 谷歌
-
Homepage: https://sihyun.me/PVDM/
-
Paper: https://arxiv.org/abs/2302.07685
-
Code: https://github.com/sihyun-yu/PVDM
据称PVDM:是第一个用于视频合成的latent扩散模型,它学习低维隐空间中的视频分布,可以在有限资源下使用高分辨率视频进行有效训练,以使用单个模型合成任意长度的视频,代码刚刚开源!单位:KAIST, 谷歌
6. Solving 3D Inverse Problems using Pre-trained 2D Diffusion Models
本文提出DiffusionMBIR:一种用于3D医学图像重建的扩散模型重建策略,实验证明:其能够实现稀疏视图CT、有限角度CT和压缩感知MRI的最先进重建。
视觉和语言(Vision-Language)
7. GIVL: Improving Geographical Inclusivity of Vision-Language Models with Pre-Training Methods
本文提出GIVL:一种地理包容性视觉和语言预训练模型,在地理多样化的V&L任务上实现了最先进的和更均衡的性能。
目标检测(Object Detection)
8. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
超越YOLOv5、YOLOX、PPYOLOE、YOLOR等目标检测网络!
9. DETRs with Hybrid Matching
本文提出一种非常简单且有效的混合匹配方案,以解决基于 DETR 的方法在多种视觉任务(2D/3D目标检测、姿态估计等)上的低训练效率,并提高准确性,如助力PETRv2、TransTrack和可变形DETR等网络性能提升,代码已开源!
10. Enhanced Training of Query-Based Object Detection via Selective Query Recollection
即插即用!本文提出选择性查询回忆(SQR):一种基于查询的目标检测器训练新策略,可以很容易地插入到各种DETR变体中,显著提高它们的性能,代码已开源!
点击进入—>
【计算机视觉】微信技术交流群
最新CVPP 2023论文和代码下载
后台回复:
CVPR2023,
即可下载CVPR 2023论文和代码开源的论文合集
后台回复:
Transformer综述,
即可下载最新的3篇Transformer综述PDF
目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer333,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!
▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
2023
年 2 月 28 日凌晨,
CVPR
2023
顶会
论文
接收
结果
出炉
!
CVPR
2023
收录的工作中 " 扩散模型、多模态、预训练、MAE " 相关工作的数量会显著增长。
整理:AI算法与图像处理
CVPR
2023
论文
和代码整理:https://github.com/DWCTOD/
CVPR
2023
-Papers-with-Code-Demo欢迎关注公众号 AI算法与图像处理,获取更多干货:大家好,最近正在优化每周分享的
CVPR
论文
, 目前考虑按照不同类别去分类,方便不同方向的小伙伴挑选自己感兴趣的
论文
哈大家好,目前给每天的
论文
汇总接入chatGPT帮忙总结,目前在...
近日,
CVPR
2023
论文
接收
结果
出炉
。近年来,
CVPR
的投稿数量持续增加,今年收到有效投稿 9155
篇
,和
CVPR
2022 相比增加 12%,创
历史
新高
。最终,大会收录
论文
2360
篇
,
接收
率为 25.78 %。本次,旷视研究院有 13
篇
论文
入选,涵盖3D 目标检测、多目标跟踪、模型压缩、知识蒸馏等多个领域。以下为入选
论文
简介 :????01VoxelNeXt:Fully Sparse...
作者|小书童 编辑| 集智书童点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【全栈算法】技术交流群为了设计快速神经网络,许多工作都集中在减少浮点运算(FLOPs)的数量上。然而,作者观察到FLOPs的这种减少不一定会带来延迟的类似程度的减少。这主要源于每秒低浮点运算(FLOPS)效率低下。为了实现更快的网络,作者重新回顾了FLOPs的运算符,并证明...
CVPR
2023
顶会
论文
接收
结果
出炉
啦!
CVPR
2023
主委会官方发布这次
论文
接收
数据:有效投稿 9155
篇
(比
CVPR
2022 增加12%),收录
2360
篇
,
接收
率为25.78 %。我整理了
CVPR
2023
的
论文
&代码,分享给大家~持续更新中…扫码添加我领取资料此外,还有AAAI
2023
的
论文
&代码,分享给大家~收持续更新中…扫码添加我领取资料最后,我...
来自:圆圆的算法笔记进NLP群—>加入NLP交流群
论文
标题:LexLIP: Lexicon-Bottlenecked Language-Image Pre-Training for Large-Scale Image-Text Retrieval下载地址:https://arxiv.org/abs/2302.02908根据一张图片检索相关文本,或者根据一段文本检索相关图片,在现在的工业界中越...
80、半监督学习、弱监督学习/无监督学习/自监督学习。36、行为识别/动作识别/检测/分割/定位。46、场景重建/视图合成/新视角合成。74、迁移学习/domain/自适应。23、图像复原/图像增强/图像重建。26、图像去噪/去模糊/去雨去雾。32、人脸生成/合成/重建/编辑。35、图像&视频检索/视频理解。41、GAN/生成式/对抗式。68、小样本学习/零样本学习。40、文本检测/识别/理解。17、视频生成/视频合成。27、图像编辑/图像修复。31、人脸识别/检测。42、图像生成/图像合成。
本文提出了一种新的预训练模型架构(iTPN ),该架构由多个金字塔形的Transformer层组成。每个层都包含多个子层,其中一些是普通的self-attention和feed-forward层,而另一些则是新的pyramid层。Pyramid层是一种新的层类型,它被设计为对输入进行多粒度的表示学习。此外,iTPN 还使用了一些其他的技巧,以提高模型的鲁棒性和泛化能力。