喜欢就关注 AIZOO 吧!

今日 AI 资讯主要有:字节跳动在 Github 开源了一个锤子,帮我们高效率训练深度学习模型;VFormer开源,一个基于 PyTorch 的 视觉 Transfomer 模块化的开源库。

CGAN模型用pytorch pytorch模型库_人工智能

这个名字不是我恶搞,它的确就叫锤子(Hammer)。官方的介绍是:



CGAN模型用pytorch pytorch模型库_CGAN模型用pytorch_02

翻译一下:一个高效的训练深度学习模型的库。本仓库提供了基于 PyTorch 的高效训练库。

因为此仓库刚刚开源一天多,star 还不多,而且提供的模型也不太多,主要是 styleGAN、styleGAN2、styleGAN3。当然,看官方的介绍,里面会提供越来越多的各种模型,而不是仅限于 GAN。

CGAN模型用pytorch pytorch模型库_算法_03

StyleGAN3 效果

这个仓库,很明显起得名字很大气,而且介绍也很大气,说不准未来会真的做成一个高效训练的库。

我们关注这种代码有什么意义呢?主要是深度学习发展日新月异,通过看大公司开源的代码,我们可以很好的学习一些新特性,以及代码的组织结构。

让我们静观其变吧。

CGAN模型用pytorch pytorch模型库_深度学习_04

VFormer:基于 PyTorch 的模块化的视觉 Transmer 库



CGAN模型用pytorch pytorch模型库_算法_05

库特性:

提供知名的 ViT 的实现,我们将他们分解为模块化组件(如编码器、注意力机制和解码器)。通过组合不同架构的组件,可以轻松开发自定义模型。

目前已经实现的知名算法:



CGAN模型用pytorch pytorch模型库_深度学习_06

用法:

例如想使用 WindowAttention

from vformer.attention import WindowAttention

window_attn = WindowAttention(
        dim=128,
        window_size=7,
        num_heads=2,
        **kwargs,
    )

SwinEncoder:

from vformer.encoder import SwinEncoder

swin_encoder = SwinEncoder(
        dim=128,
        input_resolution=(224, 224),
        depth=2,
        num_heads=2,
        window_size=7,
        **kwargs,
    )

以及整体算法实现:

from vformer.encoder import SwinEncoder

swin_encoder = SwinEncoder(
        dim=128,
        input_resolution=(224, 224),
        depth=2,
        num_heads=2,
        window_size=7,
        **kwargs,
    )

好啦,今天的 AI 早报就介绍这两个最新开源的库吧。早安~

CGAN模型用pytorch pytorch模型库_CGAN模型用pytorch_07