清荷月下猫的博客_LLM25_2_51CTO博客

鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

# LLM25_2

L2G3000

L2G3000

LMDeploy 量化部署进阶实践设置最大kv cache缓存大小MDeploy的kv cache管理器可以通过设置--cache-max-entry-count参数，控制kv缓存占用剩余显存的最大比例。默认的比例为0.8lmdeploy chat /root/models/internlm2_5-7b-chat --cache-max-entry-count 0.4LMDeploy 规定&nbs

权重

浮点数

缓存

原创 7月前 141 阅读

L1G6000

L1G6000

评测本地模型通过命令评测 InternLM2.5-1.8B-Chat 模型在 C-Eval 数据集上的性能。由于 OpenCompass 默认并行启动评估过程，我们可以在第一次运行时以 --debug 模式启动评估，并检查是否存在问题。在 --debug 模式下，任务将按顺序执行，并实时打印输出。python run.py --datasets ceval_gen --models hf_inte

ci

python

sed

原创 7月前 111 阅读

L1G5000

L1G5000

XTuner 微调实践微调yi_6b_qlora_custom_sft_e1 zephyr_7b_beta_full_custom_pretrain_e1 zephyr_7b_beta_qlora_alpaca_e3 zephyr_7b_beta_qlora_custom_sft_e1 ========================================================

json

sed

原创 7月前 151 阅读

L1G4000

conda create -n llamaindex python=3.10 conda activate llamaindex pip install einops==0.7.0 protobuf==5.26.1 pip install llama-index==0.10.38 llama-index-llms-huggingface==0.2.0 "transformers[torch]=

初始化

加载数据

原创 7月前 101 阅读

L1G3000

L1G3000

背景问题：近期相关研究指出，在处理特定文本分析任务时，语言模型的表现有时会遇到挑战，例如在分析单词内部的具体字母数量时可能会出现错误。这里利用对提示词的精确设计，引导语言模型正确回答出“strawberry”中有几个字母“r”。

语言模型

文本分析

原创 7月前 187 阅读

L1G2000

L1G2000

一、MindSearch 开源的 AI 搜索引擎二、书生·浦语 InternLM 开源模型官方的对话类产品三、书生·万象 InternVL 开源的视觉语言模型官方的对话产品

语言模型

搜索引擎

原创 7月前 94 阅读

L1G1000

L1G1000

书生大模型全链路开源体系

链路

原创 7月前 99 阅读

L0G4000

L0G4000

HF/魔搭/魔乐社区https://huggingface.co/ 以internlm2_5-1_8b举例，查看Hugging Face上该模型的地址https://huggingface.co/internlm/internlm2_5-1_8b 下载internlm2_5-7b-chat的配置文件以下载模型的配置文件为例，先新建一个hf_download_josn.py 文件

配置文件

json

python

原创 7月前 127 阅读

L0G3000

L0G3000

一、Git工作区、暂存区和 Git 仓库区工作区（Working Directory）：当我们在本地创建一个 Git 项目，或者从 GitHub 上 clone 代码到本地后，项目所在的这个目录就是“工作区”。这里是我们对项目文件进行编辑和使用的地方。暂存区（Staging Area）：暂存区是 Git 中独有的一个概念，位于 .git 目录中的一个索引文件，记录了下一次提交时将要存入仓库区的

git

暂存区

工作区

原创 7月前 104 阅读

L0G2000

L0G2000

创建一个名为myenv的新环境conda create --name myenv python=3.9激活环境conda activate myenv退出环境conda deactivate其他常见的虚拟环境管理命令还有#查看当前设备上所有的虚拟环境 conda env list #查看当前环境中安装了的所有包 conda list #删除环境（比如要删除myenv） conda env remo

Python

原创 7月前 118 阅读

L0G1000

L0G1000

一、创建开发机二、SSH及端口映射ssh -p xxxxxx root@ssh.intern-ai.org.cn -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null三、端口映射端口映射是一种网络技术，它可以将外网中的任意端口映射到内网中的相应端口，实现内网与外网之间的通信。通过端口映射，可以在外网访问内网中的服务或应用，实现跨越网

LLM

原创 7月前 172 阅读

欢迎