技术小白狮的博客_51CTO博客

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

欢迎

以视觉为中心的多模态大型语言模型 Cambrian-1 在线运行教程

以视觉为中心的多模态大型语言模型 Cambrian-1 在线运行教程

Cambrian-1 是由谢赛宁和 Yann LeCun 团队研发的一系列以视觉为中心的多模态大型语言模型（MLLMs），旨在通过大型语言模型和视觉指令调整来评估不同的视觉表示，提供对模型和架构的新见解。使用云平台：OpenBayesopenbayes.com/console/signup?r=sony_0m6v 登录到 OpenBayes 平台后，打开「公共教程」，找到「在线运行寒武纪

语言模型

人工智能

深度学习

语言处理

大模型

原创 3月前 39 阅读

高分辨率框架 HiDiffusion 运行教程，快速生成高质量 8k 图像

高分辨率框架 HiDiffusion 运行教程，快速生成高质量 8k 图像

HiDiffusion 是旷视科技推出的开发的一种创新框架，旨在提升预训练扩散模型在生成高分辨率图像方面的创造力和效率。这是一种无需训练即可提高预训练扩散模型的分辨率和速度的方法，通过将 HiDiffusion 应用于各种预训练的扩散模型，不仅可以将图像生成的分辨率提高至 4096×4096，而且能将图像生成速度提升 1.5 至 6 倍。这一方法不仅解决了对象重复和高计算负担的问题，而且在生成高分

人工智能

深度学习

机器学习

语言模型

图像处理

原创 3月前 43 阅读

强势超越 Llama3？ Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了

强势超越 Llama3？ Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了

Gemma-2-9b-Chinese-chat 是首个基于 google/ gemma -2-9b-it 构建的中文指令调优语言模型，由清华大学的人工智能博士王慎执与北京航空航天大学的人工智能博士郑耀威开源，采用了 ORPO 算法微调，专为中文和英文用户量身定制。该模型经过超 10 万条偏好对的精细调优，与最初的 google/gemma-2-9b-it 相比，该模型显著减少了「中文问题带英文答案

人工智能

Gemma2

Google

Llama 3

大语言模型

原创 3月前 65 阅读

YOLOv10 目标检测算法使用教程

YOLOv10 目标检测算法使用教程

YOLO （You Only Look Once) 系列是当前最主流的端侧目标检测算法，由 Joseph Redmon 等人首次提出，由于其在计算成本与检测性能之间实现了有效平衡，故而成为实时物体检测领域的标杆。YOLOv10是由清华大学研究人员基于 Ultralytics Python 包开发的实时目标检测方法，旨在解决之前YOLO 版本在后处理和模型架构方面的不足，通过消除非最大抑制(NMS)

物体检测

目标检测

Image

YOLOv10

数据集

原创 3月前 1190 阅读

MuseV 虚拟人视频生成框架使用教程

MuseV 虚拟人视频生成框架使用教程

MuseV 是在 2024年3月由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架，专注于生成高质量的虚拟人视须和口型同步。它利用先进的算法，能够制作出具有高度一致性和自然表情的长视频内容。其可与已经发布的 MuseTalk 结合使用可以构建完整的「虚拟人方案」。

虚拟人

图生视频

人工智能

机器学习

深度学习

原创 3月前 66 阅读