2025年12月19日,OpenAI正式发布新一代智能编程模型GPT-5.2-Codex,官方称其为目前最先进的编程智能体,在长周期任务执行、大规模代码重构、Windows系统兼容性以及视觉理解能力方面实现显著提升。
即日起,订阅用户可通过Codex命令行工具及集成开发环境插件体验该模型,API接口预计在未来数周内逐步开放。
本次更新主要体现在四个方面。其一,增强长程任务处理能力,引入原生上下文压缩机制,能够在跨周期协作中持续保留项目进展状态,适用于持续数周的大型项目重构任务,实现全程上下文连贯理解,同时将Token使用效率提高三成。其二,提升复杂代码操作的稳定性,在代码重构与语言迁移等场景下,如从Java转为Kotlin,模型的执行可靠性相较前代GPT-5.1-Codex-Max提升40%,面对计划变更或尝试失败时,可自主调整并优化策略,减少人工干预需求。
在专业评估测试中,GPT-5.2-Codex表现突出。在SWE-Bench Pro基准测试中,针对真实软件工程任务如修复开源项目漏洞、生成补丁等功能,任务完成率达到55.6%,高于GPT-5.2的50.8%,成为首个突破“半自动化开发”关键节点的模型。在Terminal-Bench 2.0测试中,涉及代码编译、AI模型训练、云服务器配置等终端操作,平均任务耗时由前代的15分钟缩短至8分钟,错误率下降六成,整体性能远超当前行业均值。

评论
更多评论