【OpenAI宣布推出最强编程代理:Codex,推动软件开发从“人工主导”迈向“AI协同”模式】萍聚社区-德国热线-德国实用信息网人工智能

多客科技 发表于 2025-5-17 20:30

OpenAI宣布推出最强编程代理:Codex,推动软件开发从“人工主导”迈向“AI协同”模式

作者：微信文章
— 聚焦人工智能，每天更新，欢迎关注 —

OpenAI宣布推出一款基于云的编程代理：Codex。Codex基于先进的AI技术，结合云端计算、并行任务处理与强化学习能力，致力于实现代码开发、调试、维护的全流程自动化，推动软件开发从“人工主导”迈向“AI协同”模式。

OpenAI代理研究团队负责人乔什·托宾（Josh Tobin）在最近的一次简报中表示：“我们将代理视为人工智能系统，它可以代表您长时间运作，通过与现实世界互动来完成大量工作。”Codex完全符合这个定义。“我们的愿景是，ChatGPT将几乎成为一个虚拟的同事——不仅仅是回答快速的问题，还能在一系列任务中协作完成重要的工作。”

Codex由codex-1提供支持，codex-1是OpenAI基于最强推理模型o3微调的一个版本，针对软件工程任务进行了优化。OpenAI表示，codex-1生成的代码比o3更“干净”，更精确地遵循指令，并且会对其代码进行迭代测试，直到获得通过的结果。OpenAI发布的模型性能数据显示，新的Codex-1代理在内部软件工程任务上的性能优于OpenAI的所有最新推理模型。

Codex代理在云端的沙盒虚拟计算机中运行。通过连接GitHub，Codex的环境可以预装用户的代码库。OpenAI表示，该AI编码代理只需1到30分钟即可编写简单功能、修复错误、回答有关代码库的问题、运行测试等任务。Codex还可以同时处理多个软件工程任务，并且在运行时不会限制用户访问他们的计算机和浏览器。

OpenAI产品负责人亚历山大·恩比里科斯（Alexander Embiricos ）表示，o3模型的许多安全工作也适用于Codex。Codex能够可靠地拒绝开发“恶意软件”的请求，此外，Codex在隔离环境中运行，无法访问互联网或外部API。这限制了Codex落入恶意攻击者手中的危险程度，但也可能会影响其实用性。

Codex今日起面向ChatGPT Pro、企业版和团队版的订阅用户开放。OpenAI表示，初期将向这些用户提供充足的请求额度，但未来几周后将对该工具实施使用频率限制，届时用户需要购买额外积分来使用Codex。ChatGPT Plus和教育版用户也将很快获得Codex的访问权限。

Codex的发布正值AI编码工具领域竞争加剧之际，根据SimilarWeb的最新数据，在过去12周内，以开发人员为中心的AI工具的流量激增了75%，凸显了编码助手的需求炙手可热。几天前还有报道称OpenAI斥资30亿美元收购了AI编码平台开发商Windsurf，但OpenAI或Windsurf均未正式确认任何交易。昨天Windsurf推出了自己的程编码基础模型SWE-1系列，专为支持整个软件工程生命周期而构建，从调试到长时间运行的项目维护。目前来看，这两家并不会很快结盟。

值得注意的是，AI编码代理与其他生成式AI系统一样，容易出错。微软近期的一项研究发现，业界领先的AI编码模型仍难以可靠地调试软件。Claude 3.7 Sonnet的平均成功率最高（48.4%），其次是OpenAI的o1（30.2%）和o3-mini（22.1%）。其他研究表明，由于在理解编程逻辑等方面存在缺陷，代码生成模型往往会引入安全漏洞和错误。最近对人工智能编程工具Devin的评估发现，它在20项编程测试中只能完成3项。

OpenAI将Codex设想为新开发工作流程的核心，工程师现在可以将高级任务分配给代理并与他们异步协作。正如代理研究团队负责人乔什·托宾（Josh Tobin）所说，“编码是整个经济中许多有用事物的基础。加速编码是将AI的好处分配给人类（包括我们自己）的一种特别高杠杆的方式。

参考资料：https://openai.com/index/introducing-codex/

https://techcrunch.com/2025/05/16/openai-launches-codex-an-ai-coding-agent-in-chatgpt/

https://venturebeat.com/ai/business-leaders-are-losing-trust-in-their-data-agentic-analytics-promises-a-fix/

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

OpenAI宣布推出最强编程代理:Codex,推动软件开发从“人工主导”迈向“AI协同”模式