相信很多粉丝朋友对chatgpt肯定不陌生,但是呢,他在国内的使用有一定的门槛,相信还是有不少朋友因此望而止步。没关系,咋们国内的ai产品也层出不穷,很多公司都陆陆续续的推出了自己的ai大模型,比如阿里的通义千问,百度的文心一言,字节的豆包等等,今天让我们一起来看一下小编最近新了解到的ai大模型:腾讯混元助手。

腾讯混元助手是腾讯开发的大语言模型,今年通过备案后,腾讯混元大模型也已经面向C端用户陆续开放体验,用户通过小程序或网页端,就能与腾讯混元对话。

网页端地址:https://hunyuan.tencent.com/   

场景一、代码生成能力

听说混元大模型的代码能力最近有较大幅度的提升,那接下来让我们通过一个简单的案例来体验一下他的能力。

下面我们先来介绍一下背景:

小编是一名测试人员,目前在测试的产品跟证券的业务有关,由于涉及到多个国家地区的业务,因此会涉及到多套测试环境的部署,这么多的测试环境+uat环境,脚本的同步批量执行+结构的对比就成了一个比较麻烦的事情。数据库的话都是用的mysql。

接下来让我们一起看一下混元大模型能否帮助我们去解决这个问题:(由于生成的都是以代码为主,中间过程就不记录完整的截图)

prompt1:我需要保持多态测试环境的mysql表结构一致,以及批量执行建表和加字段的脚本等,请问用python怎么实现。要求可以同时对多个环境执行脚本,并且数据库的信息和db文件要分别写在配置文件中,数据库配置文件中要支持给每个配置设置环境名称

腾讯混元大模型初体验_测试环境

虽然我强调db脚本文件要写在配置文件中,这里还没有放到文件里面去,没关系,接下来我再要求它改成db通过读取文件的方式获取

prompt2:db执行脚本要改成从文件中获取

通过这两个指令,基本上已经可以帮到我解决目前的这个场景,AI生成的脚本在调试的时候,可能会遇到两个问题:

1、db文件中可能会存在一些中文字符啥的,这个你可以再继续询问小助手,他会帮你解决。

2、一般我们执行db文件的话,文件中不可能只有一条sql语句 ,一般肯呢个存在多条,这个用脚本去执行的时候,ai生成的脚本一般都是直接一起执行,这个在执行的时候其实是会报错的,当你把错误信息发给ai之后,他只会让你去检查是否有语法错误啥的,并不会帮你去把sql脚本进行拆分执行。但是换一个方式去向他提问的时候,他会帮你把文件拆分为单条语句去执行:

腾讯混元大模型初体验_配置文件_02

总结:对于代码纠错这块的场景来说,与chatgpt对比没感到太大的区别 ,关键在于你怎么样向他去提问发送指令。这里有一点很重要:一条路行不通的时候,一定要尝试换一个思路去解决。当我发现脚本执行失败的时候,我发现不管是混元,还是gpt以及文心一言等,都只是会让你去检查sql有没有语法错误,哪怕我把完整的sql贴上去,他也是没办法帮我们去修正程序。虽然工具的出现给我们带来了很大的遍历,但是如何更有效的去利用工具才是关键。

针对上面的场景,其实可以再加一些prompt,让他将我们的代码更加完善,比如,执行脚本执行报错了需要跳过,继续执行后面的。每个环境脚本执行的结果需要记录下来。然后脚本执行完之后,可以自动帮我们去对比各个环境之间表结构的差异,如果有不一致的,可以帮我们输出结构同步的脚本。

场景二:用来解决工作中遇到的一些小问题

No1:开发昨天突然问我,jira有没有办法查询某个开发做过的单子

说实话,jira我之前都没用过,也就到了现在这个公司才开始接触,我用的多的JQL查询一般也就是查 经办人 = 自己,并且状态不是完成状态的单子进行监控,像这种经办人曾经是某个人的,我还不知道怎么去查

后面试了一下混元助手和gpt,发现他们都能帮我解决这个问题:

腾讯混元大模型初体验_mysql_03

腾讯混元大模型初体验_mysql_04

从上面两张图可以看出,小助手对上下文的理解能力还是可以的,第一个问题回答的基本就跑题了,当我再补充描述的时候,它立马就回答正确了。

No2:我之前没接触过es,然后最近测的业务需要查里面的数据 ,我就问ai我要怎么查数据:

腾讯混元大模型初体验_配置文件_05

腾讯混元大模型初体验_mysql_06

腾讯混元大模型初体验_测试环境_07

从上面三张图可以发现 ,混元助手和gpt的回答都是差不多的,一下子就直接给出了我想要的回答,文心一言一上来就给我整的是代码的方式去查询,虽然也能实现,但确不是我一开始所期望的效果,得后面继续给它其他指令才能达到我的预期。

场景三:画图能力

画图的话,这里主要一起对比下文心一言VS混元模型

腾讯混元大模型初体验_mysql_08

腾讯混元大模型初体验_mysql_09

总结:初步体验了一下,我觉得在我的日常工作中,完全可以用腾讯的混元模型去代替gpt3.5去使用的,毕竟gpt的使用有一定的门槛,而且查的数据还不是很新,有诸多限制,腾讯的混元助手从响应速度、生成内容的准确性来看,目前都还不错,最重要的一点 ,反正目前还是可以免费使用体验咯~。