OpenAI于今日发布全新智能编程模型GPT-5.2-Codex,官方称其为目前最先进的编程智能体,在长周期任务处理、大规模代码重构、Windows系统兼容性以及视觉理解能力方面实现显著提升。即日起,订阅用户可通过Codex命令行工具及集成开发环境插件体验新功能,相关API接口预计在未来数周内逐步开放。
该版本主要在四个方面完成重要升级:
在处理长周期编程任务方面,模型引入原生上下文压缩机制,可有效维持对大型代码库的持续理解,避免跨阶段协作中出现信息丢失。以持续数周的项目重构为例,系统能始终掌握完整上下文,上下文利用效率较此前提升三成。
面对复杂工程操作如整体代码重构或语言迁移(例如从Java迁移到Kotlin),模型的执行稳定性进一步增强,相较上一代GPT-5.1-Codex-Max可靠性提高40%。即便任务过程中发生计划变更或尝试失败,系统亦能自主调整策略并优化后续步骤,减少人工干预需求。
在系统适配方面,新版模型全面支持Windows终端操作,涵盖代码编译、服务配置、依赖安装等典型场景,任务成功率达到95%以上,显著改善此前在路径解析与命令兼容方面的局限。
在专业测试中,GPT-5.2-Codex表现突出。于SWE-Bench Pro基准评估中,针对真实软件工程问题如开源项目漏洞修复与功能补丁生成,任务完成率达到55.6%,优于GPT-5.2的50.8%,成为首个突破“半自动化开发”关键节点的模型。在Terminal-Bench 2.0测试中,涉及代码编译、模型训练及云服务器配置等终端操作,平均任务耗时由前代的15分钟缩减至8分钟,出错率下降60%,整体性能领先当前行业普遍水平。

评论
更多评论