一个接口调用所有AI模型？Vercel AI Gateway 让你的应用永不宕机

原创

公众号JavaEdge 2025-09-13 23:43:55 ©著作权

文章标签 开发者基础设施生产环境 文章分类 深度学习人工智能 yyds干货盘点

©著作权归作者所有：来自51CTO博客作者公众号JavaEdge的原创作品，请联系作者获取转载授权，否则将追究法律责任

Vercel 正式发布了面向生产环境的 AI Gateway。这个服务提供了一个统一的 API 接口，开发者可以通过它调用各种大语言模型和生成式模型，从而简化集成和管理过程。

AI Gateway 让应用能够通过同一个端点向多个模型提供商发送推理请求。它支持“自带密钥”认证，开发者可以直接使用自己在 OpenAI、Anthropic 或 Google 等平台申请的 API key，而无需额外支付代币溢价。网关还提供稳定的请求路由，延迟低于 20 毫秒，确保无论底层使用哪个提供商，推理时间都保持一致。

系统的核心功能之一是故障转移机制。如果某个模型提供商出现宕机，网关会自动把请求切换到可用的其他模型，减少服务中断。同时它支持高并发请求，速率限制也面向生产级流量进行了设计。

平台还内置了可观测性功能。开发者可以查看每个请求的详细日志、性能指标和成本数据，用来分析使用模式、监控响应时间，并了解不同模型提供商之间的费用分布。通过 AI SDK 集成时，只需要在配置中指定模型标识即可发起请求。

Vercel 表示，AI Gateway 已经在内部用于支撑 v0.app，这项服务已经为数百万用户提供过支持。随着此次发布，Vercel 将这一基础设施正式开放给外部开发者，并针对生产环境做了优化。

一个类似的服务是 OpenRouter，它同样为不同的 AI 模型提供商提供统一接口。OpenRouter 更强调模型发现和跨厂商的价格透明，而 Vercel 的 AI Gateway 则侧重低延迟路由、内置的故障转移机制，以及与其现有开发工具和托管环境的集成。两者的共同目标都是简化多模型接入，但在开发体验和基础设施可靠性上各有侧重。

在 X 和 Reddit 上，开发者的反馈既有对其简洁性和灵活性的好评，也有对免费额度限制和部分模型接入的吐槽。

eToro 的技术负责人 Filipe Sommer 评论道：