Gemma-2-9b-Chinese-chat 是首个基于 google/ gemma -2-9b-it 构建的中文指令调优语言模型,由清华大学的人工智能博士王慎执与北京航空航天大学的人工智能博士郑耀威开源,采用了 ORPO 算法微调,专为中文和英文用户量身定制。

该模型经过超 10 万条偏好对的精细调优,与最初的 google/gemma-2-9b-it 相比,该模型显著减少了「中文问题带英文答案」和中英文混合的问题,在处理中文提示方面表现出色,还显著提升了逻辑推理、编程、数学及写作能力。

使用云平台:OpenBayes

openbayes.com/console/signup?r=sony_0m6v

新用户使用上述链接注册可免费获得 4 小时 RTX 4090 使用时长。

进入 OpenBayes 平台后,打开「公共教程」,找到「一键部署 Gemma-2-9B-Chinese-Chat」的教程。

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_Gemma2

点击「克隆」,接着点击「下一步:选择算力」。

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_Llama 3_02

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_Google_03

算力选择 RTX 4090,别忘了使用链接注册哦,选择后直接点击「审核并执行」。

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_大语言模型_04

确认容器信息无误后,点击「继续执行」。

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_人工智能_05

等待系统分配资源完成后,将鼠标悬停在「API 地址」处,点击上方链接即可进入 Demo 界面。

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_Google_06

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_Gemma2_07

进入 Demo 界面后就可以和模型进行对话,可以选择一个示例进行测试。

 比如我们输入「我的蓝牙耳机坏了,我该去看牙科还是耳鼻喉科」,它给我们的回答非常合理,中文理解能力非常优秀。

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_大语言模型_08

在 Parameters 处可以调整模型的参数:

System 中可以设计一些想要告诉模型的信息或者具体的要求;

Temperature 可以改变模型输出的随机性,Temperature 的值越大,模型的输出越随机;

Max new tokens 可以改变模型输出的 token 上限。

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了_大语言模型_09