最新消息

首页 > 最新消息 > 返回前页

中信建投:GPT-5.2发布,长文本思考能力提升迅速,智能体编程的最大飞跃

时间:2025年12月15日 08:48

(来源:CITIC Think Tank)

|于芳博 辛侠平

12月12日凌晨,OpenAI发布迄今为止最强大的模型系列——GPT-5.2。OpenAI官方表示,重度用户反馈AI每周能为他们节省超过10小时。而GPT-5.2的出现,正是为了将这种效率提升到新的维度。新模型分为Instant(极速版)、Thinking(思考版)和Pro(专业版)三个版本。其核心升级集中在长上下文(256KToken,近100%长文档推理准确率)、多模态(视觉错误率减半)和性能突破,GDPval测试中70.9%专业任务优于人类专家,编码、数学等基准测试居首,幻觉率降38%。GPT-5.2输入费用为每百万tokens 1.75美元,输出费用为每百万tokens 14美元,缓存输入部分可享90%的折扣。

12月12日凌晨,OpenAI发布迄今为止最强大的模型系列——GPT-5.2。OpenAI官方表示,重度用户反馈AI每周能为他们节省超过10小时。而GPT-5.2的出现,正是为了将这种效率提升到新的维度。新模型分为Instant(极速版)、Thinking(思考版)和Pro(专业版)三个版本,即日起向ChatGPT付费用户陆续开放。

本次发布最引人注目的,是OpenAI引入了一个全新的评测基准:GDPval。不同于以往那些晦涩的学术考题,GDPval覆盖了美国GDP贡献最高的9个行业中的44种职业,专门测试明确的“知识型工作任务”。结果令人咋舌:超越专家:在人类专家评审下,GPT-5.2 Thinking在70.9%的任务中,表现优于或持平于顶尖行业专家。(作为对比,GPT-5仅为38.8%)降本增效:在完成同等任务时,GPT-5.2的输出速度比专家快11倍以上,而成本不到专家的1%。

从制作复杂的投行级电子表格,到设计咨询公司的演示文稿,GPT-5.2不再是辅助你写邮件的助手,而是已经能做到直接交付成品。

在最硬核的软件工程基准测试SWE-benchVerified中,GPT-5.2Thinking拿下了80.0%的高分,刷新了行业纪录。它在前端开发和复杂UI(尤其是3D元素)处理上表现出色。只需一个提示词,它就能生成包含海浪模拟、光照调整的单页应用。

它能更可靠地调试生产环境代码,重构大型代码库。Windsurf的CEOJeffWang评价道:“GPT-5.2是自GPT-5以来智能体编码的最大飞跃……版本号的提升甚至低估了它的跨越。”

GPT-5.2 Thinking在空间理解上有了重大突破。在 ScreenSpot-Pro(GUI 截图理解)测试中,其准确率从前代的 64.2% 飙升至 86.3%。这意味着它能精准识别主板上的组件位置,或者看懂复杂的软件仪表盘。对于金融分析师查看图表、设计师分析界面,这是巨大的利好。256k 长文本的“大海捞针”在处理长文档时,GPT-5.2 展现了惊人的稳定性。在 OpenAI MRCRv2 测试中,即使是在 256k context(约 26 万 token) 的超长上下文中,它也能保持接近 100% 的准确率,精准找到你需要的信息。

GPT 5.2 Thinking 是我们迄今最强大的视觉模型,在图表推理和软件界面理解方面将错误率大幅降低,约减少了一半。面对一张低画质的主板照片,GPT-5.1(左)仅能识别寥寥数个区域,且定位模糊;而 GPT-5.2(右)展现了惊人的空间理解力,精准识别并框选出了 CPU 插槽、内存槽、PCIe 接口等核心组件,仿佛一位经验丰富的硬件工程师在审视电路板。

“这种‘空间位置理解’能力的提升,意味着 GPT-5.2 不再只是‘看图说话’,它开始具备了操作指导的潜力。在工业检修、电路板排障、甚至未来的机器人视觉导航中,这种能精准定位组件(哪怕画质不佳)的能力,是 AI 从‘识别’走向‘物理世界交互’的关键一步。”

OpenAI也用GPT-5.2 Instant兼顾到了用户体验。这款快速、强大的日常工作与学习主力模型,在信息查询类问题、操作指南与教程、技术写作和翻译方面均有明显改进,同时延续了GPT5.1 Instant引入的温暖对话语调。早期测试者特别提到,GPT-5.2 Instant的解释更清晰,能预先突出关键信息。

与此同时,API的价格也水涨船高:GPT-5.2系列模型的价格依然昂贵,达到每百万输入Token为1.75美元,每百万输出Token为14美元。GPT-5.2 Pro更是高达每百万输入Token 21美元,每百万输出Token 168美元。

北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期;公司生产和交付延期,导致收入及增速不及预期;信息化和数字化方面的需求和资本开支不及预期;市场竞争加剧,导致毛利率快速下滑;主要原材料价格上涨,导致毛利率不及预期;汇率波动影响外向型企业的汇兑收益与毛利率;人工智能技术进步不及预期;汽车与工业智能化进展不及预期。

证券研究报告名称:《GPT-5.2发布,长文本思考能力提升迅速,智能体编程的最大飞跃

对外发布时间:2025年12月14日

报告发布机构:中信建投证券股份有限公司 

本报告分析师: 

于芳博 SAC 编号:S1440522030001

SFC 编号:BVA286

辛侠平 SAC 编号:S1440524070006

查看更多董秘问答>>

[返回前页] [关闭本页]