这份经合组织(OECD)2026 年 2 月发布的人工智能研究论文,聚焦 2030 年前 AI 的潜在发展轨迹,基于专家洞见、实证数据和战略前瞻方法,分析了 AI 发展的趋势、核心不确定性,构建了四种主场景及多款变体,最终为政策制定者提供了应对 AI 多元发展可能的参考,核心结论为 2030 年前 AI 发展存在高度不确定性,无任何一种场景可被排除。以下是核心内容总结:
研究意义:AI 近年发展迅猛,能力持续提升,政府亟需理解其未来轨迹,以制定政策捕捉技术红利、应对潜在影响。
研究方法:融合前沿文献回顾、全球 AI 顶尖专家访谈评审、战略前瞻情景分析、历史趋势外推四种方式,分析基于 2025 年 10 月前的信息,未对各场景分配概率,仅提供合理发展方向参考。
评估框架:依托 OECD 测试版 AI 能力指标,从语言、社会互动、问题解决、创造力、元认知和批判性思维、知识学习与记忆、视觉、物理操作、机器人智能9 个维度,以 1-5 级(5 级为人类水平)评估 AI 能力。2024 年末最先进 AI 在各维度得分 2-3 级,能力呈现不均衡特征。
AI 在多类基准测试中表现快速提升,已在博士级科学问题、国际数学奥赛、编程竞赛等领域达到或超越人类水平,多语言翻译、数字任务处理接近人类表现,且自主完成长复杂任务的能力持续增强,在科学发现、制药研发等现实领域也有实际应用。
人类仍在持续学习、元认知与自主性、动态现实问题解决、创造力、物理操作、社交互动六大关键领域领先 AI,且 AI 存在稳健性不足、幻觉问题,对低资源语言推理表现差,跨场景泛化能力弱。
技术层面:规模定律的有效性是否持续、推理计算的规模收益能否泛化、记忆 / 持续学习 / 身体能力 / 元认知 / 创造力的突破难度;
输入层面:计算和数据扩展是否受电力、水资源、芯片产能限制,算法效率提升速度能否维持,AI 在自身开发中的软件工程赋能效果,以及法规、投资、地缘政治、能源政策等社会经济制度因素的影响。
论文基于发展速度将 2030 年前 AI 发展分为进展停滞、进展放缓、进展持续、进展加速四大主场景,各场景均有对应的能力指标评分、实现路径、历史类比,并衍生出不同能力发展失衡的变体,核心特征如下:
核心特征:2025 年后 AI 进展基本停滞,能力与 2025 年持平,仅在应用集成和用户友好性上优化,仍依赖人类大量支持,幻觉、泛化问题未解决,物理和社交能力薄弱;
变体:狭义工具 AI(编码 / 数学等窄任务问题解决能力提升至 3 级)、简单 AI 代理(元认知能力提升至 3 级,可自主完成简单数字任务)。
核心特征:AI 能力有增量提升但速度大幅放缓,知识库更完善、结构化推理达研究人员水平,幻觉减少,可自主完成人类数小时至数天的数字任务,记忆有所改善但持续学习仍弱,机器人星空智能科技能力仅限受控环境;
能力评分:语言、社会互动等多维度提至 3-4 级,物理操作、机器人智能仍为 2 级;
变体:简单机器人(物理操作、机器人智能提至 3 级)、社会限制 AI(创造力等维度评分降低,难以应对复杂现实社交互动)。
核心特征:2025-2030 年进展与 2020-2025 年相当,AI 可自主完成人类约一个月的数字专业任务,知识基础近乎全面,持续学习接近人类水平,机器人可处理工厂 / 仓库外的部分动态物理任务,具备基本人类社交技能;
变体:健忘 AI(记忆 / 学习能力仍为 3 级,拖累社交和问题解决)、仅数字 AI(物理操作、机器人智能仍为 2 级,数字领域能力进一步提升)。
核心特征:2025-2030 年进展超此前五年,AI 在多数认知维度达人类水平,可自主完成几乎所有数字专业任务,持续学习能力突破,机器人能处理多行业动态物理任务,可流畅融入人类社交环境;
能力评分:所有认知维度达 5 级(人类水平),物理操作、机器人智能达 4 级;
变体:人工通用智能(AGI)(物理操作、机器人智能也达 5 级,全维度匹配人类能力)、超智能(所有维度得分超 5 级,在数量或质量上超越人类能力)。
趋势外推:AI 能以 50% 成功率完成的任务长度(以人类完成时间计)呈指数增长,软件工程任务每 7 个月翻倍,自动驾驶等任务翻倍速度较慢;四大场景对应不同外推假设,如停滞为任务长度达当前 2 倍后平台期,加速为翻倍速度每次加快 10%。
专家共识:专家对 2030 年 AI 发展速度高度不确定、信心低,多数认为进展放缓 / 持续是最可能的场景,但也认可停滞 / 加速的合理性;专家预计语言、结构化推理、数字自动化等能力进展更快,物理操作、创造力、元认知等进展较慢,且对 AI 通用化还是专业化占主导、是否能形成稳健物理世界模型等问题存在分歧。
核心结论:当前实证证据无法排除任何一种场景及变体,2030 年前 AI 发展轨迹跨度极大,从与当前能力持平的停滞,到全面超越人类的加速均具合理性;这种高度不确定性源于 AI 创新的快速性,以及驱动 AI 发展的核心因素能否持续发挥作用的未知性。
政策启示:政策制定者在制定 AI 相关政策时,必须充分考虑所有潜在发展轨迹,既要制定策略捕捉 AI 技术带来的经济和社会红利,也要提前布局,管理 AI 进展停滞或加速带来的各类潜在影响,兼顾创新发展与风险防控。