研究 RESEARCH

AI 安全边界

能力、风险、防御 · 2025–2026 的九条线索

AI 安全边界

从能力的天花板出发,到对齐与控制的深层论证,再到 2025–2026 前沿的实测进展与中美格局——把 AI 安全这片地形画成一张可走的图。

A.I. · 9 PIECES

九篇文章构成的研究地图:

互相之间有大量交叉引用——每篇可以独立读,但合起来才是一张完整的图。

研究文章

  1. 第 1 期 AI 能力的上限 思考片段 · 5065 字 #AI #能力上限 #信息 #物理 #数学
  2. 第 2 期 AI 安全:那些深刻而有理论支撑的风险观点 文献综述 · 11539 字 #AI #对齐 #风险 #理论 #Bostrom #Yudkowsky
  3. 第 3 期 从判断到计算:AI 风险的另一种存亡 思考片段 · 5257 字 #AI #意义 #判断 #意义式存亡
  4. 第 4 期 前沿 AI 风险:2025–2026 的几个转向 文献综述 · 5063 字 #AI #对齐 #前沿 #2025 #2026 #scheming
  5. 第 5 期 AI 安全的防御前沿:六条路线与它们的墙 文献综述 · 4205 字 #AI #防御 #可解释性 #对齐 #RLHF
  6. 第 6 期 AI 风险与安全科学:五条贯穿线索 思想综述 · 4630 字 #AI #安全科学 #认识论 #技术哲学
  7. 第 7 期 AI 科技的前沿:五条线索 文献综述 · 3591 字 #AI #前沿 #推理 #agent #具身
  8. 第 8 期 AI 学术前沿:内容、背景与人物 人物思想综述 · 5480 字 #AI #学术 #图灵奖 #Hinton #Hassabis #Sutton
  9. 第 9 期 中国与世界的 AI 对比:进展、时间线与评注 文献综述 · 4293 字 #AI #中美 #时间线 #DeepSeek #OpenAI