Love丶伊卡洛斯的博客_51CTO博客

鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

VLLM启动命令参数简单记录

vLLM服务优化配置摘要：重点参数包括模型路径、GPU显存利用率(0.9)、最大并发序列数(2-512)、批处理token数(5大并发2)，而4B模型可支持更高并发(12)。

人工智能

ai

llm

API

自动下载

原创 1月前 191 阅读