2023年6月第2周大模型荟萃
- 2023.6.12
- 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。
1、百度推出代码助手 Comate
6 月 6 日,在文心大模型成都技术交流会上,百度智能云推出 Comate 代码助手,并正式开放邀测。借助文心大模型的理解、推理能力,Comate 可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。未来,开发者可以通过插件等形式,在主流开发软件中使用 Comate 代码助手。
Comate 号称已覆盖 30 余种编程语言,尤其在 C/C++、Python、Java、Go、PHP、JavaScript 等多个主流语言表现出色。
但要注意的是,这是邀请测试,连官网网址都没有,注定是普通人接触不到的存在,随便吹。
2、新加坡国立大学发布 AI 模型 GOAT,算数能力强于 GPT-4
新加坡国立大学研究者推出了 Goat 模型,称该 AI 模型“专门用于算术问题”。研究人员表示“在对 LLaMA 模型进行微调后,Goat 在算数上实现了比 GPT-4 更高的准确度与更出色的性能”。据介绍,研究人员在具备 24GB 显存的 GPU 上进行训练,并将最终得到的模型使用 BIG-bench 算数子任务进行测试,准确率结果较为出众,领先于业内的 Bloom、GPT-NeoX、OPT 等模型。其中零样本的 Goat-7B 的准确率甚至一度超过了少样本学习后的 PaLM-540 模型,在大数计算方面远超 GPT-4。
3、国内26家单位联合发布业内首份AIGC数据版权倡议书
在国内,学界、商界、司法界以及第三方机构有关人工智能和版权的讨论也正在进行。近日,中国版权协会主办了远集坊第五十四期文化讲座《人工智能生成内容版权问题研讨》,邀请了司法界、科技界以及数字内容产业的七位嘉宾做分享。本次活动中,中文在线、同方知网、中国工人出版社等 26 家单位共同发布了国内首份有关 AIGC 训练数据版权的倡议书。
《倡议书》面向 AIGC 领域专家、学者及 AIGC 从业机构,分别从深化版权问题研究、版权赋能产业发展、避免侵权、引导 AI 生成内容的合理使用、提升版权保护意识、优化内容授权渠道这六个方面提出了倡议,覆盖了从 AIGC 模型研发到产品使用,从版权问题理论研究到数据流通实践的各个环节。
4、商汤与上海AI实验室等发布“书生·浦语”大模型
6 月 7 日,商汤科技、上海AI实验室联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型“书生·浦语”(InternLM)。“书生·浦语”具有 1040 亿参数,是在包含 1.6 万亿 token 的多语种高质量数据集上训练而成。全面评测结果显示,“书生·浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越 ChatGPT 的成绩,其中就包括中国高考各个科目的数据集(GaoKao)。
好不好用,是否超越 ChatGPT,不要自己吹,吹多了人会自大,赢得用户,用户的使用评价才是关键。
5、谷歌 DeepMind 发布新的 AI 系统,以发现更快算法
Alphabet 旗下的 AI 研究实验室 Google DeepMind 的研究人员 6 月 7 日发布了一个新的 AI 系统,可以提高计算的效率和可持续性。这项最新突破专注于发现更快的计算机算法,而计算机算法是软件开发的基础,所以这项成果具备极高的实用价值。
6、基于 ChatGPT 的应用开发框架 PromptAppGPT,可实现全自动编译开发
GitHub 上近期开源了一款基于 ChatGPT 的应用开发框架 PromptAppGPT。通过 PromptAppGPT,只需使用提示语即可完成许多工作事项,例如代码自动生成、基于 GPT-3.5 的文本生成、DALL-E 图像生成、集成的代码编辑器 + 编译器 + 运行器、自动用户界面生成、插件扩展等功能。使用此开源框架有两点要注意,一是目前仅仅 release 了第一个版本,功能还很弱,bug也多,只适用于体验;二是要正常使用此软件,先决条件是必须拥有 OpenAI API Key。
7、科大讯飞发布“讯飞星火认知大模型”V1.5
科大讯飞发布公告,宣布该公司在 6 月 9 日 14 点召开“讯飞星火认知大模型 V1.5 发布会”,会中将介绍 “讯飞星火认知大模型”的新进展,并发布配套“星火”App 及“星火助手中心”。据介绍,“讯飞星火认知大模型”V1.5 开放式问答取得了一定突破,多轮对话和数学能力得到了升级,此外,模型的“文本生成”、“语言理解”、“逻辑推理能力”都得到了持续提升。
科大讯飞自己认为,“中文已超越 ChatGPT”,在“国内大模型中遥遥领先”。不过你要是询问“Mozilla和Firefox的关系”,讯飞星火仍然会回答“抱歉,您这个问题我暂时无法回答,我抓紧学习一下,争取下次给您满意的答复。”(认知大模型从v1.0学习到v1.5版仍然如此),或者你询问“iphone14pro什么时候上市”,讯飞星火会回答“目前,还没有关于 iPhone 14 Pro 的确切上市日期。不过,根据以往的惯例,苹果公司通常会在每年的秋季发布会上发布新款 iPhone,因此 iPhone 14 Pro 可能会在今年的秋季发布会上正式亮相。同时,苹果公司也会在随后的时间里开始向零售商和在线商店提供预订服务,并最终在数周或数月后开始正式发售。具体的上市时间还需要等待官方发布后才能确定。”而这个问题你用任意搜索引擎搜索都能得到答案“2022年9月9日”,说明讯飞星火认知大模型的训练数据比较OLD,还说明其中文距离 ChatGPT 仍有一段差距。建议实事求是是根本,不要盲目自大。
8、谷歌推出新 AI 工具 Imagen Editor
6 月 10 日消息,谷歌于近日推出了名为 Imagen Editor 生成式 AI 工具,此工具可以根据用户输入的文本要求,在现有图片的基础上进行二次创作。Imagen Editor 并非生成完整的图像内容,而是基于用户的描述,在现有图片上进行修改和创作。
另外,谷歌云业务部门表示,正在与 Mayo Clinic 合作测试一项新的服务,以定制专用的医疗领域的聊天机器人。通过这项最新推出的基于生成式人工智能的企业搜索服务,未来在医疗健康领域,生成式 AI 技术的发展将允许医生通过简单的查询更快地获得患者的病史、影像记录、基因组学或实验室等数据,即使这些信息以不同的格式或者位置存储。
9、百度将推出全新 AI 对话软件“万话”
百度计划推出一款全新的AI对话软件,采用一对一的对话式聊天场景,名字叫做“万话”。据企查查显示,百度旗下关联公司“北京百度网讯科技有限公司”已经申请注册万话软件著作权。
文心大模型是一对多(用户:平台)的对话式场景,但是从用户侧来看,它就是一对一的对话式聊天场景。所以可以大胆推测,“万话”并没有什么创新,应该是现有文心业务的二次包装,用作业务拓展。