AI 初创公司 Cosine 宣布,他们已经打造出世界上最强的 AI 编程助手 Genie,并在行业评测基准 SWE-Bench 中获得 30.08% 的好成绩(SWE-Bench 是用来评估大模型解决现实中软件问题的基准),超过了 Devin 和 GPT-4。
Genie 的技术报告中列出了训练数据包含的 15 种编程语言,Java、JS、C、C++、C#、Rust、Python 等热门语言,以及常用的 Scala、Kotlin、Swift、PHP 等也都全部涵盖。
其中,JavaScript、Python、TypeScript 和 TSX 是数据集中占比最多的语言,其余的占比均为 3%。
Cosine 公司表示,Genie 可以完全自主地与用户进行沟通,并完成解决 Bug、构建功能、重构代码等任务。
Cosine 采用特殊数据集和自我改进机制,使 Genie 在复杂编码中表现出色。
目前 Genie 已开放申请试用:https://cosine.sh/register,未来将推出更多惊喜功能。