丰饶之后：AI Coding 观察报告 2.0

一句话

AI Coding 的第一轮争论正在结束。代码生成走向丰饶后，真正的稀缺转移到规格、验证、维护、品味、运营和判断力。

说明：这是基于公开微信文章制作的精读页面。为避免全文转载，只整理结构化摘要、关键数字和阅读路径。完整内容请看原文或按原文提示下载 PDF。

核心判断

当生成代码变成商品，品味、判断力、验证能力、工程纪律会依次浮现。

关键信号

87.6%SWE-bench Verified 公开模型高位，标准编码任务接近规模化自动完成。

$50BCursor 估值被报道推进到 500 亿美元，开发者内循环工具价值被重新定价。

25%YC W2025 中四分之一创业公司 95% 以上代码由 AI 生成。

275×文章称 gh CLI 约 200 tokens，GitHub MCP 约 55,000 tokens，Agent 接口效率差异巨大。

45%Veracode 发现部分 AI 代码任务会引入已知安全漏洞，验证成为硬瓶颈。

30–41%GitClear 对 2.11 亿行代码的分析指向技术债务增加，维护压力后移。

9 个月后：7 条“非共识”的回望

第一版报告中的非共识，二版大多已经变成共识。新的判断点不在“AI Coding 是否成立”，而在重心迁移到哪里。

产品形态

本地×云端、辅助×自主的四象限仍成立，但重心明显向 CLI 和异步 Agent 迁移。IDE 继续 Agent 化，IM 也成为异步 Agent 的入口。

模型选择

“自研 + 第三方”的多模型策略仍是主框架。商业模型在公开榜单上趋同，但前沿实验室的内部储备与公开模型之间拉开差距。

用户价值

提效争议跨过第一阶段。METR 后续实验从慢 19% 逆转为快 18%，但自报节省时间和真实 PR 吞吐之间仍有测量落差。

付费模式

主流产品转向 Token、Credit、ACU 等按需或混合计费。每次 Agent 失败都是直接成本，倒逼企业建设驾驭框架。

企业态度

渐进与激进并存。大厂内部 AI 代码占比并未完全兑现最激进预测，但强制使用、绩效挂钩和政策缺位同时扩大分化。

组织影响

替代与扩张发生在不同技能层。初级岗位承压，高级工程师杠杆放大，非开发者也被拉进“构建者”队伍。

市场格局

“先验战场”被验证。专业开发者没有消失，但角色从写代码转向表达意图、组织系统、评估结果。

丰饶之后：6 个结构性洞察

洞察 1

模型加速趋同，前沿差距不减

公开商业模型在榜单上挤到很小区间，但 Anthropic Mythos Preview 与 Opus 4.7 的双轨发布说明：商业可见层趋同，实验室前沿层继续分化。

洞察 2

Agent 原生成为工具演化方向

IDE 正升级为 Agent 编排平台，CLI 赢得开发者内循环，MCP 更适合企业外循环，Skills/SOP 则补齐非开发者的可复用流程。

洞察 3

代码生成规模化，验证成为新瓶颈

“如何实现”不再是核心瓶颈。前端瓶颈是把需求翻译成可执行规格，后端瓶颈是安全、技术债和长期维护。

洞察 4

产品构建零门槛，品味和运营变稀缺

AI 让从零到原型变便宜，但“原型墙”依然存在。剩下的 30% 往往涉及分发、运维、合规、设计判断和产品取舍。

洞察 5

SaaS 没死，只是在重新分配

被冲击的是把 API 包装成收费 UI 的单功能中间层。平台层、自建层和产出计价会变强，复杂度封装层会被重估。

洞察 6

开发者被双向重定义

“做什么”从编写变成编排；“谁能做”从工程师扩展到更多非开发者。底层被压缩，中层出现 Agent 管理角色，高层被杠杆化。

稀缺并未消失，它迁移了

文章最值得带走的不是某个工具排名，而是稀缺性的迁移：当代码生成不再稀缺，能定义正确问题、约束 Agent 行为、验证产出、维护系统、做产品判断的人会更稀缺。

这也是为什么 AI Coding 对其他行业有“先验战场”意义：每个行业都会经历类似过程，先是生产动作被自动化，然后管理自动化结果的能力变得更贵。

对我们意味着什么

不要只比较模型分数，要看 Agent 工作环境、接口成本和可验证性。
把“规格 → 执行 → 验证 → 维护”做成闭环，比单纯追求生成速度更重要。
CLI、SOP、技能库、测试框架会成为 Agent 时代的基础设施。
产品团队的稀缺项会转向品味、运营、合规、分发和对复杂系统的判断。