全球最强AI程序员诞生!Genie挑战GPT-4和Devin


Genie,一款由Cosine公司发布的AI程序员,它在权威测试平台SWE-Bench上的评分高达30.08%,以断崖式的优势领先于Devin的13.8%和Swe-agent+GPT-4的12.47%,被誉为目前全球最强的AI程序员。

Genie的诞生并非一蹴而就。早在2022年12月,Cosine的联合创始人Alistair Pullen就已在伦敦大学的一次路演中展示了Genie的原型。他的初衷是开发一款能够端到端自动执行编码和优化的AI机器人,无需任何人为干预。

Genie之所以能够大幅度领先于其他知名产品,与其独特的训练数据和方法密不可分。Genie的训练不依赖常规的大模型微调,而是采用了一个特殊的数据集,这个数据集包含了人类程序员的推理过程,如信息的完整传承、知识的逐步发现,以及基于实际案例的决策制定步骤等。

Genie在训练过程中采用了独特的“自我改进机制”。初始训练在大量高质量数据上进行,使模型达到“完美”状态。随后,开发人员通过Genie生成合成数据,并将其注入到后续模型训练中,以丰富错误和复杂情况。这一过程类似于母亲教孩子走路,每当Genie跌倒或姿势不正确时,都会得到及时的纠正。

Genie的功能覆盖了功能开发、BUG修复、代码重构、代码小改动、代码测试以及编写代码文档和更新等。它支持的编程语言包括JavaScript、Python、Java、C#、C++等几十种主流语言,几乎涵盖了所有编程领域的需要。

知名开发者Mckay表示,他对Genie充满期待,并希望能够尽快测试这款产品。他目前已拥有Devin的使用权限,因此能够轻松评估Genie的性能。

尽管目前Genie仍处于申请测试阶段,但Alistair已经表示,现在可以接受申请注册,未来2—3周内将发放测试权限,并在发布时增加一些小惊喜功能。

体验地址:https://cosine.sh/register

备注:资讯来源AIbase基地