斯坦福开源端侧大模型Octopus v2，2B参数量可在移动端运行，性能超越GPT-4，准确率超Llama7B

原创

努力犯错AI 2024-05-05 23:08:29 ©著作权

©著作权归作者所有：来自51CTO博客作者努力犯错AI的原创作品，请联系作者获取转载授权，否则将追究法律责任

斯坦福大学研究人员近日推出了开源端侧大模型Octopus v2，引起了广泛关注。Octopus v2拥有20亿参数量，可以在智能手机、车载系统等终端设备上高效运行，在准确性和推理速度方面都超越了GPT-4。

斯坦福开源端侧大模型Octopus v2，2B参数量可在移动端运行，性能超越GPT-4，准确率超Llama7B_数据集

Octopus v2针对自动化任务中的函数调用问题进行了优化设计。相比于传统的检索增强生成(RAG)方法，Octopus v2在训练和推理阶段采用了独特的函数token策略:

这些针对性的设计使Octopus v2能够在各种复杂场景中生成准确的函数调用，无论是单独的、嵌套的还是并行的。

斯坦福开源端侧大模型Octopus v2，2B参数量可在移动端运行，性能超越GPT-4，准确率超Llama7B_数据集_02

基准测试结果显示，Octopus v2在推理速度和准确率方面都超越了业界领先的大模型:

在单个A100 GPU上，Octopus v2的推理速度比"Llama7B + RAG方案"快36倍，比依赖A100/H100集群的GPT-4-turbo快168%。

斯坦福开源端侧大模型Octopus v2，2B参数量可在移动端运行，性能超越GPT-4，准确率超Llama7B_嵌套_03

在函数调用准确率上，Octopus v2的得分比"Llama7B + RAG方案"高31%，与GPT-4和RAG + GPT-3.5持平，达到98%-100%。

斯坦福开源端侧大模型Octopus v2，2B参数量可在移动端运行，性能超越GPT-4，准确率超Llama7B_函数调用_04

如此出色的性能，得益于Octopus v2巧妙的函数token设计以及针对性的训练，大幅降低了上下文长度需求，提升了推理效率。

Octopus v2的开源发布，为广大开发者带来了全新的机遇。这款端侧大模型在性能、效率和部署便利性方面的突破，必将推动端侧AI技术进一步发展。未来，随着Octopus v2在更多应用场景的落地，我们有理由相信它将助力各行各业实现智能化升级，让人工智能惠及大众生活的方方面面。

Huggingface模型下载

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯