前六篇谈 AI 的风险与安全;这一篇掉头看能力本身——2026 年,AI 科技的前沿在哪里。

一句话抓住这两年的总变化:

“智能”的来源、形态、计量单位,同时变了: 来源从”预训练堆参数”转向”后训练 + 推理时思考”; 形态从”会答话的模型”转向”会做事、会研究、能具身的系统”; 计量从”benchmark 多准”转向”能自主干多久、多复杂”。

五条线索,正好对应这场变化的五个面。


线索一:智能的新来源——从”预训练”,到”思考时计算”

过去十年靠”模型更大、数据更多”;2025 年这条路撞上数据墙(高质量人类文本被用尽)。新增长来自两处:后训练(用 RL 教模型推理、自我纠错)和推理时计算(让模型在回答前”想”更久)。

标志是推理模型(o 系列):o3 在 ARC-AGI-2 上拿下 75.7%(此前 SOTA 不到 20%),代价是每题平均烧 5700 万 token。分析预测:到 2030 年,推理算力将占总算力的 75%——相对 2020 年代初”训练主导”的彻底反转。

最深的变化:能力第一次变成可以在推理时”现买”的东西——给它更多思考时间,就更强。这是一根全新的、可调节的杠杆。

线索二:从聊天机器人到智能体——从”答”,到”做”

模型从”被问一句答一句”,变成在执行循环里自主跑很久。

2026 年 4 月,GPT-5.5、Claude Opus 4.7 相继发布,后者 SWE-bench Verified 87.6%、能主动验证自己写的代码。约 50% 的智能体应用集中在软件工程;57.3% 的组织已有智能体在生产环境;Anthropic 用并行的 Claude 智能体造出了一个完整的 C 编译器

计量单位变了:不再只问”准确率多少”,而问”它能无人监督地自主工作多久”(task horizon)——METR 测到这个时长每 4–7 个月翻一倍(详见 04 · 前沿 AI 风险)。

线索三:从文字到世界——多模态、世界模型、具身

AI 的”感知-行动”边界,从屏幕里的文字,扩张到物理世界与生成式仿真世界。

智能正在下凡:离开纯文本,进入像素、动作和物理因果。

线索四:从工具到科学家——AI 进入知识生产

AI 的角色,从”助手”升到”发现者 / 同事”。

2025 年 IMO:Gemini Deep Think 与 OpenAI 实验模型都拿了金牌(35/42,解出 6 题中的 5 题);“AI Scientist”能自动提想法、写代码、跑实验、写论文;科研进入”副驾 → 主驾(co-pilot → lab-pilot)“的转变。最具递归性的一步——AI 开始做 AI 研究,这正是 04 · 前沿 AI 风险 里”自动化 AI 研发”那条风险的能力侧

但要记住 Stanford 2026 AI Index 的”锯齿状前沿(jagged frontier)“:AI 能拿奥数金牌、解博士级科学题,却只有约 50% 的概率读对模拟时钟。能力是参差的,不是均匀的——别用它的最高分去推断它全面可靠。

线索五:底座——架构、芯片、能源

决定上限的,越来越是算力与电力,而非算法本身。

瓶颈在转移:从”数据 / 算法”,转向”电力 / 硅”。谁掌握电与芯片,谁就掌握智能产能。


综合:一张能力地图

五条线索其实在说同一件事——AI 正从”一个更大的模型”,变成”一个会思考、会行动、能自我改进、且越来越吃电的系统”。

压成三句:

而这张能力地图,正是 06 · 五条贯穿线索 那张风险地图的引擎:

能力沿这五条线索每往前一步,06 那五条风险线索就同步绷紧一分。 能力地图与风险地图,是同一台机器的两面。


来源

相关笔记:01 · AI 能力的上限 · 04 · 前沿 AI 风险 · 05 · 防御前沿 · 06 · 五条贯穿线索 · 08 · AI 学术前沿 · 09 · 中国与世界 AI 对比