喜欢就关注 AIZOO 吧!
今日 AI 资讯主要有:字节跳动在 Github 开源了一个锤子,帮我们高效率训练深度学习模型;VFormer开源,一个基于 PyTorch 的 视觉 Transfomer 模块化的开源库。
这个名字不是我恶搞,它的确就叫锤子(Hammer)。官方的介绍是:
翻译一下:一个高效的训练深度学习模型的库。本仓库提供了基于 PyTorch 的高效训练库。
因为此仓库刚刚开源一天多,star 还不多,而且提供的模型也不太多,主要是 styleGAN、styleGAN2、styleGAN3。当然,看官方的介绍,里面会提供越来越多的各种模型,而不是仅限于 GAN。
StyleGAN3 效果
这个仓库,很明显起得名字很大气,而且介绍也很大气,说不准未来会真的做成一个高效训练的库。
我们关注这种代码有什么意义呢?主要是深度学习发展日新月异,通过看大公司开源的代码,我们可以很好的学习一些新特性,以及代码的组织结构。
让我们静观其变吧。
VFormer:基于 PyTorch 的模块化的视觉 Transmer 库
库特性:
提供知名的 ViT 的实现,我们将他们分解为模块化组件(如编码器、注意力机制和解码器)。通过组合不同架构的组件,可以轻松开发自定义模型。
目前已经实现的知名算法:
用法:
例如想使用 WindowAttention
from vformer.attention import WindowAttention
window_attn = WindowAttention(
dim=128,
window_size=7,
num_heads=2,
**kwargs,
)
SwinEncoder:
from vformer.encoder import SwinEncoder
swin_encoder = SwinEncoder(
dim=128,
input_resolution=(224, 224),
depth=2,
num_heads=2,
window_size=7,
**kwargs,
)
以及整体算法实现:
from vformer.encoder import SwinEncoder
swin_encoder = SwinEncoder(
dim=128,
input_resolution=(224, 224),
depth=2,
num_heads=2,
window_size=7,
**kwargs,
)
好啦,今天的 AI 早报就介绍这两个最新开源的库吧。早安~