- 文章推出了一种具备实时特性的视频超分方法,其将ESPCN的亚像素卷积层和3种时间空间融合的方式(early fusion、slow fusion、3D卷积)进行结合,产生了ESPCN的加强版本——spatio-temporal network,它利用了视频时间冗余特性,在运算效率和表现力上都强于ESPCN在视频上的处理。
- 文章推出了一种STN的变体——运动补偿模块,它可以和spatio-temporal网络联合训练,使得VESPCN可以进行端对端的训练。MC模块的加入使得SR网络的输入端具有更加连续的时间特性,这也让表现力相比单独使用spatio-temporal网络得到了进一步提升!
这篇文章不再是只针对Single-Image做超分,而是主要为了提升视频的分辨率;本文由Twitter推出了一种称之为VESPCN的网络结构,主要利用运动估计模块和时序空间模块来对连续帧输入做超分。VESPCN是第二代ESPCN,解决了ESPCN无法利用视频具有高度时间冗余的特点,因此VESPCN将ESPCN升级成Spatial-Temporal-sub-pixel卷积网络,并结合运动补偿完成视频超分任务,此外VESPCN在single-Image上可以减少一定程度的资源消耗。参考目录:①深度学习端到.
Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network
arXiv:1609.05158v2
利用高效的亚像素卷积神经网络实现实时单图像和视频的超分
参考资料:
论文内容:https://zhuanlan.zhihu.com/p/76338220
Github/pytorch:https://github.com/JuheonYi/VESPCN-P
Real-Time Video Super-Resolution with Spatio-Temporal Networks and Motion Compensation
参考资料:
论文内容:https://blog.csdn.net/u014447845/article/details/89928794
Github/pytorch:https://github.com/JuheonYi/VESPCN-PyTorch
主要创新点
将亚像素卷积的效率优势与时间融合策略相结合,给出了视频SR的实时时
这篇文章推出了一种具有亚像素卷积层结构的SR算法——ESPCN;相比于SRCNN直接对HRHRHR领域像素做卷积,ESPCN是直接对输入LRLRLR像素做特征提取,在当时来说,可以算是一种提高计算效率的有效途径。
参考文档:
Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural NetworkAbstract1 Introduction2 Method2.1.
这篇文章基于ESPCN提出了针对视频重建任务的网络结构VESPCN。ESPCN在图像和视频重建任务上都相比先前的方法都有一定的提升,但ESPCN只能对单帧图像进行重建,并不能利用视频多帧图像的时间相关性信息。该模型由对齐网络和融合时空SR网络组成
VESPCN:Real-Time Video Super-Resolution with Spatio-Temporal Networks and Motion CompensationAbstract1 Introduction2 Method2.1 Spat.
conda install pytorch torchvision -c soumith
conda install pytorch torchvision cuda80 -c soumith # install it if you have installed cuda
PyTorchNet
pip install git+https://github.com/pytorch/tnt.git@master
OpenCV
conda install opencv
火车,Val数据集
火车和val数据集是从采样的。 火车数据集具有16700个图像,而Val数据集具有425个图像。 从下载数据集(访问代码:5tzp),然后将其提取到data目录中。 终于跑了
python data_utils.
作者的目的是引进一个spatio-temporal sub-pixel convolution networks,能够处理视频图像超分辨,并且做到实时速度。还提出了一个将动作补偿和视频超分辨联合起来的算法,并且可以端到端训练。
与单帧模型相比,时空网络即可以减少计算,又可以维持输出质量。
2、introduction
超分辨问题一直是信号处理领域中...
之前已经写了挺多的博文关于image 超分了,接下来研究一下video 超分。之前博文已经对VESPCN进行了理论的介绍(《学习笔记之——基于深度学习的图像超分辨率重构》)
之前做的超分都是基于pytorch的,这次这个项目是tensorflow的。。。。然后一开始学习超分的代码是cafe的。。。。。。
ESPCN
ESPCN(efficient sub-pixel convolutional neural network)是创业公司Magic Pony Technology的Wenzhe Shi和Jose Caballero作品。该创业团队主要来自Imperial College London,目前已被Twitter收购。
对于diffusion超分,它是一种图像超分辨率增强的方法,通过利用图像中的细节信息来增加图像的分辨率。Diffusion超分技术通过应用扩散过程来实现,该过程通过在图像中传播信息来恢复丢失的高频细节。具体而言,它使用图像的低频信息和一些先验知识来预测丢失的高频信息,以提高图像的细节和清晰度。
Diffusion超分主要分为两个阶段:首先是预处理阶段,它对图像进行降采样,生成低分辨率图像。然后,在还原阶段中,将低分辨率图像传递到扩散过程中,通过迭代地应用扩散算子来传播和恢复丢失的高频信息。该过程将逐渐增加图像的细节和清晰度。
值得注意的是,Diffusion超分是一种计算密集型算法,需要大量的计算资源和时间来实现。此外,它对于一些特定类型的图像效果较好,而对于其他类型的图像可能效果不佳。因此,在使用Diffusion超分之前,需要根据具体应用场景和需求来评估其适用性。