MIT与宾夕法尼亚大学联合研究团队(NBER工作论文w35275)分析了10万名开发者、1.8亿GitHub仓库数据及微软Copilot遥测数据,揭示AI编程的"生产力漏斗"真相。
核心数据:
| 生产层级 | 自动补全时代 | 同步代理时代 | 三代累计增幅 |
|---|---|---|---|
| 代码行数 | +228% | +741% | 17.3倍 |
| 修改文件数 | — | +187% | 3.9倍 |
| 代码提交 | — | +109% | — |
| 合并请求 (PR) | — | +65% | — |
| 独立项目 | — | +26% | — |
| 最终软件发布量 | +10.2% | +20% | 仅 +30% |
关键发现:
- 低技能开发者获益更大:低活跃开发者在AI辅助下提效217%,而高活跃开发者为62%
- Claude Code 效率最突出:同步提效+199%,远超 OpenAI Codex(+94%)和 GitHub Sync Agent(+43%)
- "僵尸应用"激增:iOS平台三个月内评分<10的新应用从79%升至86%;Chrome插件下载<10次的比例从18%升至31%
- 瓶颈在于人类审查:经济学模型显示,AI代码与人工审查的替代弹性仅0.25,审查、测试能力跟不上代码生成速度