多客科技 发表于 2025-5-17 20:30

OpenAI宣布推出最强编程代理:Codex,推动软件开发从“人工主导”迈向“AI协同”模式

作者:微信文章
— 聚焦人工智能,每天更新,欢迎关注 —

OpenAI宣布推出一款基于云的编程代理:Codex。Codex基于先进的AI技术,结合云端计算、并行任务处理与强化学习能力,致力于实现代码开发、调试、维护的全流程自动化,推动软件开发从“人工主导”迈向“AI协同”模式。



OpenAI代理研究团队负责人乔什·托宾(Josh Tobin)在最近的一次简报中表示:“我们将代理视为人工智能系统,它可以代表您长时间运作,通过与现实世界互动来完成大量工作。”Codex完全符合这个定义。“我们的愿景是,ChatGPT将几乎成为一个虚拟的同事——不仅仅是回答快速的问题,还能在一系列任务中协作完成重要的工作。”

Codex由codex-1提供支持,codex-1是OpenAI基于最强推理模型o3微调的一个版本,针对软件工程任务进行了优化。OpenAI表示,codex-1生成的代码比o3更“干净”,更精确地遵循指令,并且会对其代码进行迭代测试,直到获得通过的结果。OpenAI发布的模型性能数据显示,新的Codex-1代理在内部软件工程任务上的性能优于OpenAI的所有最新推理模型。



Codex代理在云端的沙盒虚拟计算机中运行。通过连接GitHub,Codex的环境可以预装用户的代码库。OpenAI表示,该AI编码代理只需1到30分钟即可编写简单功能、修复错误、回答有关代码库的问题、运行测试等任务。Codex还可以同时处理多个软件工程任务,并且在运行时不会限制用户访问他们的计算机和浏览器。

OpenAI产品负责人亚历山大·恩比里科斯(Alexander Embiricos )表示,o3模型的许多安全工作也适用于Codex。Codex能够可靠地拒绝开发“恶意软件”的请求,此外,Codex在隔离环境中运行,无法访问互联网或外部API。这限制了Codex落入恶意攻击者手中的危险程度,但也可能会影响其实用性。

Codex今日起面向ChatGPT Pro、企业版和团队版的订阅用户开放。OpenAI表示,初期将向这些用户提供充足的请求额度,但未来几周后将对该工具实施使用频率限制,届时用户需要购买额外积分来使用Codex。ChatGPT Plus和教育版用户也将很快获得Codex的访问权限。

Codex的发布正值AI编码工具领域竞争加剧之际,根据SimilarWeb的最新数据,在过去12周内,以开发人员为中心的AI工具的流量激增了75%,凸显了编码助手的需求炙手可热。几天前还有报道称OpenAI斥资30亿美元收购了AI编码平台开发商Windsurf,但OpenAI或Windsurf均未正式确认任何交易。昨天Windsurf推出了自己的程编码基础模型SWE-1系列,专为支持整个软件工程生命周期而构建,从调试到长时间运行的项目维护。目前来看,这两家并不会很快结盟。



值得注意的是,AI编码代理与其他生成式AI系统一样,容易出错。微软近期的一项研究发现,业界领先的AI编码模型仍难以可靠地调试软件。Claude 3.7 Sonnet的平均成功率最高(48.4%),其次是OpenAI的o1(30.2%)和o3-mini(22.1%)。其他研究表明,由于在理解编程逻辑等方面存在缺陷,代码生成模型往往会引入安全漏洞和错误。最近对人工智能编程工具Devin的评估发现,它在20项编程测试中只能完成3项。

OpenAI将Codex设想为新开发工作流程的核心,工程师现在可以将高级任务分配给代理并与他们异步协作。正如代理研究团队负责人乔什·托宾(Josh Tobin)所说,“编码是整个经济中许多有用事物的基础。加速编码是将AI的好处分配给人类(包括我们自己)的一种特别高杠杆的方式。

参考资料:https://openai.com/index/introducing-codex/

https://techcrunch.com/2025/05/16/openai-launches-codex-an-ai-coding-agent-in-chatgpt/

https://venturebeat.com/ai/business-leaders-are-losing-trust-in-their-data-agentic-analytics-promises-a-fix/
页: [1]
查看完整版本: OpenAI宣布推出最强编程代理:Codex,推动软件开发从“人工主导”迈向“AI协同”模式