IP 属地福建
Amusi 微信公众号:CVer
他 的动态
改进何恺明的MAE!谷歌新作VideoPrism:视频理解的基础视觉编码器
VideoPrism:一种基础视频编码器,出色改进了何恺明的掩码自编码器,在各种视频理解任务上的30个基准测试中实现最先进的性能,优于VideoMAE-v2、InternVideo等网络。
点击关注
@CVer官方知乎账号
,可以第一时间看到最优质、最前沿的CV、AI、3D视觉工作~
VideoPrism
VideoPrism: A Foundational Visual Encoder for Video Understanding
单位:Google 论文:
https://http://arxiv.org/abs/2402.13217
CVPR 2023 论文和开源项目合集…
YOLOv9来了!最新最强的实时目标检测器
YOLOv9来了!还在用YOLOv8、YOLOv7、YOLOv5做毕设的同学开始颤抖了。。。 本文提出可编程梯度信息(PGI)和基于梯度路径规划的通用高效层聚合网络(GELAN),最终铸成YOLOv9目标检测全新工作!性能表现SOTA!在各个方面都大大超过了现有的实时目标检测器,优于RT DETR、YOLOv8等网络,代码刚刚开源!
点击关注
@CVer官方知乎账号
,可以第一时间看到最优质、最前沿的CV、AI、3D视觉工作~
YOLOv9
YOLOv9: Learning What You Want to Lea…