主题
前言
这本书怎么用
这不是教材,而是一份面向 AI/ML 研究者 的执行手册。
它关心的不是“知识点是否覆盖得足够全”,而是:
- 当前阶段最重要的问题是什么
- 下一步最小可执行动作是什么
- 哪些工作适合交给智能体,哪些判断必须由人类承担
每章都尽量写成同一种结构:
- 目标
- 完成标准
- 输入与标准产物
- 人类-智能体协作
- 工作流
- 质量控制与常见错误
阅读建议
第一次读:按顺序读,先建立完整主链
text
01-研究思维 -> 02-文献调研 -> 03-想法生成 -> 04-新颖性验证
-> 05-实验设计 -> 06-Pilot实验 -> 07-结果分析 -> 08-自动迭代循环
-> 09-论文结构 -> 10-图表制作 -> 11-写作与润色 -> 12-投稿策略
-> 13-复盘与资产化日常使用:按问题查章节
text
“方向不清楚” -> 01, 02
“idea 不知道值不值得做” -> 03, 04
“实验该不该继续” -> 05, 06, 07
“论文写不顺” -> 09, 10, 11
“项目结束后怎么沉淀经验” -> 13适用范围
本书默认你做的是 AI/ML 研究,例如:
- 模型、算法、训练策略、评测方法
- benchmark、ablation、diagnostic study
- 以代码、实验、日志和论文为核心产物的研究项目
这意味着书中的时间预算、artifact 设计和工具选择,都面向 AI/ML 的典型工作方式。
如果你来自其他学科,流程思想可能仍有参考价值,但不要直接照搬。
人类-智能体协作约定
本书的基本假设是:
研究流程可以协作,但研究责任不能外包。
| 阶段 | 智能体更适合做什么 | 人类必须负责什么 | 建议产物 |
|---|---|---|---|
| 问题定义 | 收集背景、列候选问题、整理边界 | 判断问题是否重要且可测 | PROBLEM_NOTE.md |
| 文献与 idea | 检索、摘要、分组,并围绕同一问题生成候选解法 | 判断误读、差异化和优先级 | PAPER_TABLE.csv, IDEA_REPORT.md |
| 新颖性与实验 | 整理 closest work、草拟实验矩阵、记录 pilot | 判断 novelty、baseline 和 go / no-go | NOVELTY_REPORT.md, EXPERIMENT_PLAN.md, PILOT_LOG.csv |
| 分析与写作 | 汇总结果、草拟 finding、模拟审稿 | 决定 claim 强度、引用和最终叙事 | ANALYSIS_REPORT.md, PAPER_PLAN.md |
| 复盘与沉淀 | 整理资产、索引模板、提炼 skill 候选 | 判断哪些经验值得制度化复用 | RETROSPECTIVE.md, ASSET_INDEX.md |
因此本书默认采用下面这条规则:
智能体负责加速,人类负责背书。
全书级 Artifact 协议
从这一版开始,本书把每一章都视为一个 artifact contract:
- 有明确输入
- 有标准产物
- 有人类 review gate
- 有下游消费方
这意味着本书不只是“方法建议”,还是一套轻量级研究接口。
统一规则
- 每章至少要明确输入和输出
- 关键 artifact 进入下游前应达到
reviewed或locked - 智能体可以起草 artifact,但关键判断必须经人复核
- 文件命名尽量统一,不在不同章节重复发明新名字
完整索引见:附录 E
当前主链
当前已经稳定串起的主链是:
text
PROBLEM_NOTE.md
-> PAPER_TABLE.csv / LITERATURE_MAP.md / OPEN_QUESTIONS.md
-> IDEA_BACKLOG.csv / IDEA_REPORT.md
-> CLOSEST_WORK_TABLE.csv / NOVELTY_REPORT.md
-> EXPERIMENT_PLAN.md / PILOT_LOG.csv / ANALYSIS_REPORT.md
-> REVIEW_LOOP_LOG.md / PAPER_PLAN.md / CLAIMS_EVIDENCE_MATRIX.csv
-> FIGURE_SPEC.md / CITATION_CHECK.md / SUBMISSION_PACK.md
-> RETROSPECTIVE.md / ASSET_INDEX.md一个必须记住的边界
01 和 03 不是两个“都在想 idea”的章节,而是上下游关系:
一句判别法是:
- 换掉具体方法后仍然成立的,属于 01
- 一旦拿掉某个机制就不成立的,属于 03
全局框架图
为了避免框架图和正文脱节,本版把原来单独放在附录中的总览图直接并入前言和对应章节。
1. 全书总流程图
2. 人类-智能体协作泳道图
3. 研究产物依赖图
使用这些图时需要:
latex
\usepackage{tikz}
\usetikzlibrary{positioning,arrows.meta,fit}当前进度
当前进度上,01-研究思维 到 13-复盘与资产化 已经按这套 contract 重写完成:
- 01 定义
PROBLEM_NOTE.md - 02 产出
PAPER_TABLE.csv、LITERATURE_MAP.md、OPEN_QUESTIONS.md - 03 产出
IDEA_BACKLOG.csv、IDEA_REPORT.md - 04 产出
CLOSEST_WORK_TABLE.csv、NOVELTY_REPORT.md - 05 产出
EXPERIMENT_PLAN.md - 06 产出
PILOT_LOG.csv - 07 产出
ANALYSIS_REPORT.md - 08 产出
REVIEW_LOOP_LOG.md - 09 产出
PAPER_PLAN.md与CLAIMS_EVIDENCE_MATRIX.csv - 10 产出
FIGURE_SPEC.md - 11 产出
CITATION_CHECK.md - 12 产出
SUBMISSION_PACK.md - 13 产出
RETROSPECTIVE.md与ASSET_INDEX.md
接下来最值得做的是用一个真实 AI/ML 项目跑通整条链,验证这套 contract 的可执行性,并补一个 worked example。
核心流程
本书的流程分五段:
text
Phase 1: 找方向
问题定义 -> 文献调研 -> 想法生成 -> 新颖性验证
Phase 2: 验证想法
实验设计 -> Pilot实验 -> 结果分析
Phase 3: 迭代到可投稿
审稿反馈 -> 修复 -> 重审
Phase 4: 写论文与投稿
论文结构 -> 图表制作 -> 写作与润色 -> 投稿
Phase 5: 复盘与资产化
复盘 -> 沉淀模板 / checklist / skill 候选 -> 进入下个项目关键原则
1. 实证信号优先于理论吸引力
听起来很好的想法,如果没有 pilot 信号,优先级应低于已经出现正面信号的方向。
2. 尽早淘汰
在 pilot 阶段淘汰错误方向,比把时间花在完整主实验后再失败更便宜。
3. 好实验必须双向有价值
正结果能推动论文,负结果也应能提供边界、失败模式或反证信息。
4. 不隐藏弱点
closest work、边界条件、异常 setting 和失败 run 都应进入分析和后续叙事。
5. 项目必须沉淀成资产
如果一次项目结束后没有留下可复用模板、checklist、失败案例或 skill 候选,这条流程就没有真正闭环。
来源与扩展
本书最初主要从 ARIS 提炼而来,但当前目标不是做“ARIS 的人类版说明书”,而是持续吸收更多 AI/ML 自动化科研系统和 agent skill 的可执行经验。
当前已经纳入三类来源:
- 端到端自动化科研项目
- 深度研究 / 检索 / citation-grounded QA 项目
- research agent skill / task contract 框架
完整来源矩阵见:附录 D
这本书不包含什么
- LaTeX 语法入门教程
- 与特定子领域强绑定的细节技巧
- 非 AI/ML 学科特有的科研流程
- 投稿后的公关与传播策略
如何贡献
欢迎补充:
- 更多 AI/ML 失败案例
- 不同子方向的 worked example
- 可单独运行的自动化科研工具或 skill
- 过时信息和错误修正
致谢
当前版本主要受以下项目启发,后续还会继续扩展:
- ARIS
- Research-Paper-Writing-Skills
- claude-scholar
- 以及 附录 D 中整理的 AI/ML 自动化科研项目与 agent skills
开始之前,先记住:AI/ML 研究不是比谁更会堆概念,而是比谁更快拿到可信信号。