Skip to content

前言

这本书怎么用

这不是教材,而是一份面向 AI/ML 研究者 的执行手册。

它关心的不是“知识点是否覆盖得足够全”,而是:

  • 当前阶段最重要的问题是什么
  • 下一步最小可执行动作是什么
  • 哪些工作适合交给智能体,哪些判断必须由人类承担

每章都尽量写成同一种结构:

  • 目标
  • 完成标准
  • 输入与标准产物
  • 人类-智能体协作
  • 工作流
  • 质量控制与常见错误

阅读建议

第一次读:按顺序读,先建立完整主链

text
01-研究思维 -> 02-文献调研 -> 03-想法生成 -> 04-新颖性验证
-> 05-实验设计 -> 06-Pilot实验 -> 07-结果分析 -> 08-自动迭代循环
-> 09-论文结构 -> 10-图表制作 -> 11-写作与润色 -> 12-投稿策略
-> 13-复盘与资产化

日常使用:按问题查章节

text
“方向不清楚” -> 01, 02
“idea 不知道值不值得做” -> 03, 04
“实验该不该继续” -> 05, 06, 07
“论文写不顺” -> 09, 10, 11
“项目结束后怎么沉淀经验” -> 13

适用范围

本书默认你做的是 AI/ML 研究,例如:

  • 模型、算法、训练策略、评测方法
  • benchmark、ablation、diagnostic study
  • 以代码、实验、日志和论文为核心产物的研究项目

这意味着书中的时间预算、artifact 设计和工具选择,都面向 AI/ML 的典型工作方式。

如果你来自其他学科,流程思想可能仍有参考价值,但不要直接照搬。

人类-智能体协作约定

本书的基本假设是:

研究流程可以协作,但研究责任不能外包。

阶段智能体更适合做什么人类必须负责什么建议产物
问题定义收集背景、列候选问题、整理边界判断问题是否重要且可测PROBLEM_NOTE.md
文献与 idea检索、摘要、分组,并围绕同一问题生成候选解法判断误读、差异化和优先级PAPER_TABLE.csv, IDEA_REPORT.md
新颖性与实验整理 closest work、草拟实验矩阵、记录 pilot判断 novelty、baseline 和 go / no-goNOVELTY_REPORT.md, EXPERIMENT_PLAN.md, PILOT_LOG.csv
分析与写作汇总结果、草拟 finding、模拟审稿决定 claim 强度、引用和最终叙事ANALYSIS_REPORT.md, PAPER_PLAN.md
复盘与沉淀整理资产、索引模板、提炼 skill 候选判断哪些经验值得制度化复用RETROSPECTIVE.md, ASSET_INDEX.md

因此本书默认采用下面这条规则:

智能体负责加速,人类负责背书。

全书级 Artifact 协议

从这一版开始,本书把每一章都视为一个 artifact contract:

  • 有明确输入
  • 有标准产物
  • 有人类 review gate
  • 有下游消费方

这意味着本书不只是“方法建议”,还是一套轻量级研究接口。

统一规则

  1. 每章至少要明确输入和输出
  2. 关键 artifact 进入下游前应达到 reviewedlocked
  3. 智能体可以起草 artifact,但关键判断必须经人复核
  4. 文件命名尽量统一,不在不同章节重复发明新名字

完整索引见:附录 E

当前主链

当前已经稳定串起的主链是:

text
PROBLEM_NOTE.md
  -> PAPER_TABLE.csv / LITERATURE_MAP.md / OPEN_QUESTIONS.md
  -> IDEA_BACKLOG.csv / IDEA_REPORT.md
  -> CLOSEST_WORK_TABLE.csv / NOVELTY_REPORT.md
  -> EXPERIMENT_PLAN.md / PILOT_LOG.csv / ANALYSIS_REPORT.md
  -> REVIEW_LOOP_LOG.md / PAPER_PLAN.md / CLAIMS_EVIDENCE_MATRIX.csv
  -> FIGURE_SPEC.md / CITATION_CHECK.md / SUBMISSION_PACK.md
  -> RETROSPECTIVE.md / ASSET_INDEX.md

一个必须记住的边界

01 和 03 不是两个“都在想 idea”的章节,而是上下游关系:

一句判别法是:

  • 换掉具体方法后仍然成立的,属于 01
  • 一旦拿掉某个机制就不成立的,属于 03

全局框架图

为了避免框架图和正文脱节,本版把原来单独放在附录中的总览图直接并入前言和对应章节。

1. 全书总流程图

Global workflow of this handbook. The process is artifact-driven and iterative, but the final research decisions remain human-reviewed.
Global workflow of this handbook. The process is artifact-driven and iterative, but the final research decisions remain human-reviewed.

2. 人类-智能体协作泳道图

Human-agent collaboration in this handbook. Agents amplify search, organization, and drafting; humans remain responsible for high-stakes research decisions.
Human-agent collaboration in this handbook. Agents amplify search, organization, and drafting; humans remain responsible for high-stakes research decisions.

3. 研究产物依赖图

Artifact dependency chain. Each stage produces concrete outputs that can be reviewed, handed off, and reused later.
Artifact dependency chain. Each stage produces concrete outputs that can be reviewed, handed off, and reused later.

使用这些图时需要:

latex
\usepackage{tikz}
\usetikzlibrary{positioning,arrows.meta,fit}

当前进度

当前进度上,01-研究思维13-复盘与资产化 已经按这套 contract 重写完成:

  • 01 定义 PROBLEM_NOTE.md
  • 02 产出 PAPER_TABLE.csvLITERATURE_MAP.mdOPEN_QUESTIONS.md
  • 03 产出 IDEA_BACKLOG.csvIDEA_REPORT.md
  • 04 产出 CLOSEST_WORK_TABLE.csvNOVELTY_REPORT.md
  • 05 产出 EXPERIMENT_PLAN.md
  • 06 产出 PILOT_LOG.csv
  • 07 产出 ANALYSIS_REPORT.md
  • 08 产出 REVIEW_LOOP_LOG.md
  • 09 产出 PAPER_PLAN.mdCLAIMS_EVIDENCE_MATRIX.csv
  • 10 产出 FIGURE_SPEC.md
  • 11 产出 CITATION_CHECK.md
  • 12 产出 SUBMISSION_PACK.md
  • 13 产出 RETROSPECTIVE.mdASSET_INDEX.md

接下来最值得做的是用一个真实 AI/ML 项目跑通整条链,验证这套 contract 的可执行性,并补一个 worked example。

核心流程

本书的流程分五段:

text
Phase 1: 找方向
  问题定义 -> 文献调研 -> 想法生成 -> 新颖性验证

Phase 2: 验证想法
  实验设计 -> Pilot实验 -> 结果分析

Phase 3: 迭代到可投稿
  审稿反馈 -> 修复 -> 重审

Phase 4: 写论文与投稿
  论文结构 -> 图表制作 -> 写作与润色 -> 投稿

Phase 5: 复盘与资产化
  复盘 -> 沉淀模板 / checklist / skill 候选 -> 进入下个项目

关键原则

1. 实证信号优先于理论吸引力

听起来很好的想法,如果没有 pilot 信号,优先级应低于已经出现正面信号的方向。

2. 尽早淘汰

在 pilot 阶段淘汰错误方向,比把时间花在完整主实验后再失败更便宜。

3. 好实验必须双向有价值

正结果能推动论文,负结果也应能提供边界、失败模式或反证信息。

4. 不隐藏弱点

closest work、边界条件、异常 setting 和失败 run 都应进入分析和后续叙事。

5. 项目必须沉淀成资产

如果一次项目结束后没有留下可复用模板、checklist、失败案例或 skill 候选,这条流程就没有真正闭环。

来源与扩展

本书最初主要从 ARIS 提炼而来,但当前目标不是做“ARIS 的人类版说明书”,而是持续吸收更多 AI/ML 自动化科研系统和 agent skill 的可执行经验。

当前已经纳入三类来源:

  • 端到端自动化科研项目
  • 深度研究 / 检索 / citation-grounded QA 项目
  • research agent skill / task contract 框架

完整来源矩阵见:附录 D

这本书不包含什么

  • LaTeX 语法入门教程
  • 与特定子领域强绑定的细节技巧
  • 非 AI/ML 学科特有的科研流程
  • 投稿后的公关与传播策略

如何贡献

欢迎补充:

  • 更多 AI/ML 失败案例
  • 不同子方向的 worked example
  • 可单独运行的自动化科研工具或 skill
  • 过时信息和错误修正

致谢

当前版本主要受以下项目启发,后续还会继续扩展:


开始之前,先记住:AI/ML 研究不是比谁更会堆概念,而是比谁更快拿到可信信号。