Hi Devin,I

还记得 Devin 吗?这个由Cognition Labs开发的 世界上首位人工智能软件工程师 一经面世,其卓越的“工作能力”便促使人们开始谈论 工作替代 的问题。

Hi Devin,I

在我们之前的一篇分析中,我们发现软件工程未来的趋势已经逐步以 管理AI编程代理 展开。

Hi Devin,I

* 点击图片查看历史原文:《不久的将来,软件工程将主要围绕管理AI编程代理展开》

就在今天,Cosine推出了同类产品 Genie,并在权威测试平台SWE-Bench上以 30.08%的惊人评分,远超Devin(13.8%)和Swe-agent+GPT-4(12.47%)。

Hi Devin,I

* 数据来源:https://cosine.sh/genie

* Genie技术报告原文:https://cosine.sh/blog/genie-technical-report

Hi Devin,I

正如Genie官网上的slogan,Genie已经成为了 “全球最强的AI程序员”

Hi Devin,I

那么Genie到底有多强大?让我们一起来看看吧!

* 视频来源:https://cosine.sh/genie

Genie取得高分是因为团队采用了全新的方法。为了使模型像软件工程师一样工作,模型必须理解人类软件工程师的工作方式。他们设计了全新技术,从实际工作案例中推导出人类的推理过程,数据代表了完美的信息传递、渐进的知识发现和逐步的决策过程,涵盖了人类工程师的所有逻辑。他们使用这个独特的数据集训练Genie,而不是简单地提示基础模型。结果显示,Genie不再只是随机生成代码,而是像人类一样解决问题。

简单来说,就是让Genie完全模仿人类的开发风格以及解决BUG、优化代码的习惯,然后自动完成任务。

功能方面,Genie主要支持:

- Feature Development(功能开发)

- Bug Fixing(BUG修复)

- Refactoring(代码重构)

- Minor Changes & Chores(代码小改动和杂项)

- Test Writing(代码测试)

- Writing and Updating Documentation(撰写和更新文档)

其在数据混合中的比例分别如下:

Hi Devin,I

支持的编程语言包括JavaScript、 Python、Java、C#、C++、C、Rust、Scala、Kotlin、Swift、Golang、PHP和Ruby等几十种主流语言。

Hi Devin,I

对于全球网友们对于Genie和Devin的先后排序问题,Alistair Pullen(Cosine的联合创始人&首席执行官)也在社媒上作出了回应,其实早在2022年12月他在英国伦敦大学的一次路演中便展示过当时版本的Genie。并告诉大家这是一个能像人类一样端到端自动执行、优化编码的AI机器人。

Hi Devin,I

Alistair Pullen表示,现目前已经可以接受申请注册,未来的2至3周内测试权限将会正式发放。此外,发布时还会增加一些小惊喜功能。

目前,Genie已经开放试用申请,感兴趣的小伙伴可以前往申请体验。

申请地址:https://cosine.sh/register

--- End ---