TechOnly的博客_计算机视觉

使用Blip的预训练好的imageEncoder并替换其textDecoder

【代码】使用Blip的预训练好的imageEncoder并替换其decoder。

计算机视觉

Salesforce

原创 11天前 31 阅读

调用Blip2-T5实现image2text

【代码】调用Blip2-T5实现image2text。

计算机视觉

Salesforce

Image

原创 11天前 29 阅读

【code2image】使用bokeh画图，去掉右侧的按钮

【代码】【code2image】使用bokeh画图，去掉右侧的按钮。

计算机视觉

html

ide

原创 16天前 20 阅读

VQ-VAE的 image tokenizer 的原理

VQ-VAE 里的 vector quatization。简单来说，就是要先有一个codebook，这个codebook是一个embedding table。我们在这个embeddin

计算机视觉

数据集

欧氏距离

原创 25天前 21 阅读

调用Blip image tokenizer实现image2text

【代码】调用Blip image tokenizer实现image2text。

计算机视觉

Image

Salesforce

原创 25天前 38 阅读

Masked Autoencoders 关键信息解读

摘要的最后一句话：achieves the best accuncoders (MAE) 的应用方法，是预训练好的MAE的encode

人工智能

sed

原创 2022-07-19 19:45:30 94 阅读

BA-NET 摘要速览

https://openreview.net/group?id=ICLR.cc/2019/ConferenceBA-NET: DENSE BUNDLE ADJUSTMENT NETWORKS

bundle

深度学习

硬编码

原创 2022-07-19 16:33:21 104 阅读

pix2pix 学习笔记

利用condition-GAN，以一图输入作为condition，生成一图，以完成image-to

h

原创 2022-07-19 11:52:25 224 阅读

faster rcnn 基本概念

rpn：region proposal network IoU：Intersection-over-Union，交集并集之比 G

并集

卷积

原创 2022-07-19 11:40:10 47 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

踏雪至山巅

使用Blip的预训练好的imageEncoder并替换其textDecoder

调用Blip2-T5实现image2text

【code2image】使用bokeh画图，去掉右侧的按钮

VQ-VAE的 image tokenizer 的原理

调用Blip image tokenizer实现image2text

Masked Autoencoders 关键信息解读

BA-NET 摘要速览

pix2pix 学习笔记

faster rcnn 基本概念