CodeDevMaster的博客_LLM

Gemini CLI使用教程：在命令行中释放AI的力量

Google官方推出的gemini-cli是一个强大而简洁的命令行工具，让你可以在终端中直接与强大的 Gemini 模型进行交互。

插入图片

bash

命令行

原创精选 2月前 990 阅读

构建智能天气助手：基于大模型API与工具函数的调用实践

在人工智能快速发展的今天，大语言模型(LLM)已经成为构建智能应用的重要基础设施。本文将介绍如何利用大模型API和工具函数集成，构建一个能够理解自然语言并提供精准天气信息的智能助手。

ci

API

缓存

原创 7月前 1584 阅读 1评论

使用vLLM部署DeepSeek-R1-Distill-Qwen-7B模型：从环境配置到高效推理

本文将详细介绍如何使用 vLLM 框架部署DeepSeek-R1-Distill-Qwen-7B模型，并完成高效的推理任务。将从环境配置、模型加载、推理优化等方面一步步展开，帮助快速上手vLLM并体验其强大的性能优势。无论是深度学习开发者还是对大模型推理感兴趣的研究者，本文都能提供实用的指导。

vLLM

DeepSeek-R1

Qwen

Distill

模型

原创 7月前 2431 阅读

Ollama：一个在本地部署、运行大型语言模型的工具

Ollama是一个开源项目，它专为在本地机器上能便捷部署、以及运行大型语言模型（LLM）而设计的工具。

python

Docker

Ollama

LLM

大型语言模型

原创 2024-07-04 15:47:29 2466 阅读 1点赞

使用PEFT库进行ChatGLM3-6B模型的LORA高效微调

LORA(Low-Rank Adaptation)是一种高效的模型微调技术,它可以通过在预训练模型上添加额外的低秩权重矩阵来微调模型,从而仅需更新很少的参数即可获得良好的微调性能。这相比于全量微调大幅减少了训练时间和计算资源的消耗。

python

LORA

微调

ChatGLM3-6B

训练

原创 2024-06-27 08:58:50 1308 阅读 1点赞 1评论

使用llama.cpp实现LLM大模型的格式转换、量化、推理、部署

llama.cpp的主要目标是能够在各种硬件上实现LLM推理，只需最少的设置，并提供最先进的性能。提供1.5位、2位、3位、4位、5位、6位和8位整数量化，以加快推理速度并减少内存使用。

CUDA

llama.cpp

lllm

推理

量化

原创精选 2024-06-06 09:41:08 3053 阅读 1点赞

使用Unsloth微调Llama3-Chinese-8B-Instruct中文开源大模型

Unsloth是一个开源的大模型训练加速项目，可以显著提升大模型的训练速度，减少显存占用。本文将使用Unsloth微调Llama3-Chinese-8B-Instruct中文开源大模型。

github

python

Unsloth

Llama3-Chinese

Llama

原创精选 2024-06-03 10:40:22 1980 阅读 1点赞 1收藏

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

积跬步，至千里。

Gemini CLI使用教程：在命令行中释放AI的力量

构建智能天气助手：基于大模型API与工具函数的调用实践

使用vLLM部署DeepSeek-R1-Distill-Qwen-7B模型：从环境配置到高效推理

Ollama：一个在本地部署、运行大型语言模型的工具

使用PEFT库进行ChatGLM3-6B模型的LORA高效微调

使用llama.cpp实现LLM大模型的格式转换、量化、推理、部署

使用Unsloth微调Llama3-Chinese-8B-Instruct中文开源大模型

欢迎