相关文章推荐

乐观的香菜 · js截取最后一个标识之后/之前的内容_js中 ...· 7 月前 ·

高大的匕首 · EnumDesktopWindows ...· 1 年前 ·

失落的弓箭 · Web Audio API 介绍和 Web ...· 1 年前 ·

卖萌的青椒 · boost::asio译文-阿里云开发者社区· 1 年前 ·

痛苦的领带 · SpringSecuruty中；anonym ...· 1 年前 ·

精彩文章免费看

DiT：Transformer替换U-Net实现良好扩展的扩散模型

Vinteuil

简书作者

2023-01-08 15:38 IP属地: 湖北

Scalable Diffusion Models with Transformers

原文：https://arxiv.org/abs/2212.09748

开源：https://github.com/facebookresearch/DiT (> 630星)

paperswithcode今日热门开源

我们探索了基于transformer架构的一类新的扩散模型。我们训练图像的潜在扩散模型，将常用的U-Net主干替换为在潜在补丁上运行的transformer。我们通过Gflops测量的前向通过复杂度镜头分析了我们的扩散transformer（DiT）的可扩展性。我们发现，具有较高Gflop的DiT——通过增加transformer深度/宽度或增加输入令牌的数量——始终具有较低的FID。除了具有良好的可扩展性外，我们最大的DiT XL/2模型在类条件ImageNet 512x512和256x256基准上优于所有先前的扩散模型，在后者上实现了2.27的最先进FID。

推荐文章

乐观的香菜 · js截取最后一个标识之后/之前的内容_js中indexof找到字符最后一个之前的内容-CSDN博客

7 月前

高大的匕首 · EnumDesktopWindows function (winuser.h) - Win32 apps | Microsoft Learn

1 年前

失落的弓箭 · Web Audio API 介绍和 Web 音频应用案例分析 - 开发者头条

1 年前

卖萌的青椒 · boost::asio译文-阿里云开发者社区

1 年前

痛苦的领带 · SpringSecuruty中；anonymous和permitAll的区别。_mob604756ef1373的技术博客_51CTO博客

1 年前