Labor Market Impacts of AI: A New Measure and Early Evidence

Anthropic Research | 2026-03-05 Authors: Maxim Massenkoff, Peter McCrory 原文: https://www.anthropic.com/research/labor-market-impacts PDF: https://cdn.sanity.io/files/4zrzovbb/website/3f7fd9d552e66269bdb108e207c5d80531d04b8b.pdf 附录: https://cdn.sanity.io/files/4zrzovbb/website/e5f77fc0e77c0185110b5e4b909602791ae76eae.pdf

一句话总结

Anthropic 提出了”observed exposure”（观测暴露度）这一新指标，结合理论可行性和真实使用数据来衡量 AI 对劳动力市场的影响。核心发现：AI 远未达到理论上限，目前没有系统性失业增加，但年轻人进入高暴露职业的速度已在放缓。

核心贡献：Observed Exposure（观测暴露度）

为什么需要新指标？

过去衡量 AI 对就业的影响主要靠”理论可行性”（比如 Eloundou et al. 2023 的 beta 分数），但理论能力 ≠ 实际采用。这篇论文的创新在于：把理论能力和真实使用数据结合起来。

数据来源（三合一）

数据集	用途
O*NET 数据库	800+ 职业的任务分解
Anthropic Economic Index	Claude 真实对话中的使用模式
Eloundou et al. (2023) 的 beta 分数	任务级理论可行性评分

Beta 分数定义

beta = 1：纯 LLM 就能完成
beta = 0.5：需要额外工具辅助
beta = 0：不可行

关键设计：自动化 vs 增强

自动化使用（AI 替代人完成任务）：权重 = 1
增强使用（AI 辅助人完成任务）：权重 = 0.5

这个区分很重要——同样是用 AI，替代性使用对就业的冲击远大于辅助性使用。

五大核心发现

1. 理论 vs 现实的巨大鸿沟

AI 远未达到理论上限。

职业类别	理论可行性	实际覆盖率	差距
计算机与数学	94%	33%	61pp
办公与行政	90%	-	-

97% 的 Claude 实际使用任务落在理论上可行的类别中（Figure 1 验证），说明 beta 分数是有效的，但采用率远低于可行性。

启示：现在谈 AI 大规模替代就业还为时过早，但趋势方向是明确的。

2. 高暴露职业的增长预期更低

每增加 10 个百分点的 AI 覆盖率，BLS（美国劳工统计局）对该职业到 2034 年的增长预测就下降 0.6 个百分点。

重要对比：仅用 Eloundou 的理论指标，找不到这个相关性。只有结合真实使用数据的 observed exposure 才能捕捉到。

3. 高暴露工人的画像

高暴露 vs 低暴露工人：

维度	高暴露	低暴露	差异
女性比例	更高	更低	+16pp
白人比例	更高	更低	+11pp
亚裔比例	更高	更低	~2x
研究生学历	17.4%	4.5%	3.9x
平均收入	更高	-	+47%

启示：AI 冲击的不是传统意义上的”低端工作”，而是高学历、高收入的知识工作者。这与以往技术革命（冲击蓝领）截然不同。

4. 目前没有系统性失业增加

ChatGPT 发布以来，高暴露职业和低暴露职业之间的失业率差异”小且不显著”。

COVID 期间反而是低暴露工人（多为线下工作）失业更严重
置信区间可以检测到 1 个百分点的差异变化，所以不是检测力不足的问题

5. 年轻人进入高暴露职业的速度在放缓（预警信号）

22-25 岁年轻人的数据（Figure 7）：

高暴露职业的入职率：2024 年起下降约 0.5 个百分点/月
低暴露职业的入职率：稳定在 2%/月
ChatGPT 后的差异效应：求职成功率下降 14%（勉强统计显著）

这是全文最值得关注的发现：虽然在职者暂时安全，但新进入劳动力市场的年轻人已经受到影响。企业可能在减少对初级知识工作岗位的招聘。

暴露度最高的职业 Top 10

职业	覆盖率
计算机程序员	75%
客服代表	高（API 实现）
数据录入员	67%
（其余 7 个未列出具体数字）

零暴露职业（30% 的工人）：厨师、摩托车修理工、救生员、调酒师、洗碗工——都是需要物理操作的工作。

重要局限性

O-ring 模型 vs 均值效应：如果一个职业需要所有任务都被 AI 覆盖才会被替代（O-ring），那么均值暴露度可能高估了短期影响
数据可靠性：基于调查的就业转换数据可能有测量误差
年轻人去向不明：没被高暴露职业录用的年轻人可能转向其他职业、继续读书、或留在现有岗位——目前数据无法区分
覆盖率阈值效应：分析基于四分位比较，不同切分点结果有所不同

与历史类比

论文将 AI 的劳动力影响与以下历史事件类比：

不像 COVID（即时冲击）
更像互联网普及、贸易政策变化（渐进影响，跨年甚至跨十年）
过去对离岸外包、工业机器人、中国贸易冲击的预测都不够精确——这也是为什么需要更好的测量工具

对投资/产业的启示

AI 采用率还有巨大空间：理论可行性 94% vs 实际 33%，意味着 AI 工具市场远未饱和
知识工作自动化是主战场：高收入、高学历岗位受冲击最大，这是 B2B SaaS 和 AI agent 的核心市场
初级岗位招聘放缓是先行指标：企业可能先减少招聘再裁员，年轻人数据是”矿井里的金丝雀”
物理世界工作短期安全：零暴露的职业都需要身体操作，机器人能力尚未跟上
增强 > 替代（目前）：大部分实际使用是增强而非替代，但趋势在向自动化方向移动

方法论亮点

用 Anthropic 自己的 Economic Index 做真实使用数据源，这是独家优势——没有其他研究者能拿到这种粒度的 LLM 使用数据
自动化/增强的半权重设计是合理的折中
与 BLS 预测的交叉验证增加了可信度
Figure 1 验证了理论可行性分数的有效性（beta=1 的任务占 68% 使用，beta=0 的只占 3%）

精读日期: 2026-03-07