Skip to content

09 - 论文结构

用 claim-evidence 组织论文

目标

论文结构不是“先列一个目录”,而是回答:

当前这组 claim 和 evidence,应该怎样组织,才能既真实又有说服力?

本章的目标是:

  1. 把前面章节的研究产物压缩成一份 PAPER_PLAN.md
  2. 为每条准备写进论文的 claim 建立 CLAIMS_EVIDENCE_MATRIX.csv
  3. 明确主 claim、支持 claim、边界条件和不该写的内容
  4. 决定章节顺序、主叙事线和目标 venue 约束
  5. 10-图表制作11-写作与润色 提供稳定输入

本章回答的问题是:

哪些话可以写进标题、摘要和引言,哪些只能放结果里弱说,哪些必须删掉?

完成标准

完成本章,不等于“我有一个论文目录”,而是至少做到:

  • 你有一份经过人类复核的 PAPER_PLAN.md
  • 你有一份 CLAIMS_EVIDENCE_MATRIX.csv
  • 每个核心 claim 都能映射到具体证据和论文位置
  • 你明确知道哪些结果进主线,哪些进补充,哪些不写
  • 你能把结构交给图表和写作章节继续消费

输入与标准产物

输入

建议直接使用 01-08 章的关键产物:

输入作用
PROBLEM_NOTE.md保持论文仍然服务原始问题
NOVELTY_REPORT.md回看 claim 级定位和 closest work 风险
ANALYSIS_REPORT.md提供当前最可信的 findings 和 claim 状态
REVIEW_LOOP_LOG.md提供哪些 criticism 已解决、哪些仍需规避
目标 venue 要求约束页数、结构、实验深度和写作风格
当前图表草稿 / 表格草稿帮助判断叙事是否有足够支撑

标准产物

产物作用后续会在哪用到
PAPER_PLAN.md规划论文核心主张、结构和叙事顺序10, 11, 12
CLAIMS_EVIDENCE_MATRIX.csv把 claim、证据、位置和状态对齐10, 11

这些 artifact 的统一命名、建议路径和状态定义见:附录 E

人类-智能体协作

阶段智能体适合做什么人必须负责什么常见风险
结构草拟根据 claim 和 finding 起草章节大纲决定真正的主线和删减原则把所有结果都塞进主线
矩阵整理建立 claim-evidence-location 映射表判断证据是否真的足够把弱证据也标成已支撑
venue 对齐汇总目标会议的格式和篇幅约束决定取舍和压缩策略为迎合版式牺牲论证完整性
风险预审指出 claim 过强、证据不足和结构断裂对标题、摘要和引言的强度签字用漂亮叙事掩盖证据空洞

本章默认的工作方式是:

智能体可以帮你搭结构、填矩阵、找断裂点;人类必须决定论文到底要主打什么。

论文结构不是什么

这一章不是在做:

  • 标准五段式模板套填
  • 先写目录再希望数据自己适配
  • 把所有跑过的实验都塞进正文
  • 用更强的文字掩盖更弱的证据

论文结构的本质是:

给每个准备公开声称的 claim 分配合适的证据位置和表述强度。

工作流

Phase 0: 先冻结 paper question

在规划结构前,先回答一件事:

如果读者读完整篇论文,只能记住一句话,你希望他记住什么?

这句话通常来自三者交集:

  • PROBLEM_NOTE.md 里的核心问题
  • NOVELTY_REPORT.md 里最站得住的差异点
  • ANALYSIS_REPORT.md 里最可信的 evidence

如果这三者对不上,先不要写结构,回去修正主线。

Phase 1: 划分 claim 层级

建议把准备写进论文的 claim 只分成三层:

层级作用
Core claim标题、摘要、引言和结论都要服务的主张
Supporting claim用来补强方法有效性、机制或边界
Boundary claim用来说明方法在哪些条件下成立或失效

通常一篇 paper 最好只有:

  • 1 个 core claim
  • 2-4 个 supporting claims
  • 若干 boundary claims

如果 core claim 超过 2 个,结构通常已经开始分叉。

Phase 2: 建立 CLAIMS_EVIDENCE_MATRIX.csv

这是本章最关键的动作。

建议对每条 claim 至少写清:

字段说明
claim_idclaim 编号
claim_text准备写出的 claim
strengthstrong / medium / weak
evidence支撑该 claim 的实验、图、表或分析
location摘要 / 引言 / 方法 / 实验 / 讨论 / 补充材料
statussupported / weak / unsupported
risk_note最可能被 reviewer 攻击的点

规则很简单:

没有证据位置的 claim,不应出现在标题、摘要和引言。

Phase 3: 用证据反推章节顺序

不要按“大家都这么写”的惯性决定结构,而应反问:

  1. 读者要先知道什么背景,才会接受这个问题重要?
  2. 读者要看到什么 closest work,才会理解差异点?
  3. 读者要先看到哪一组实验,才会相信 core claim?
  4. 哪些诊断和边界结果应放正文,哪些应放附录?

对多数 AI/ML 论文,合理顺序通常是:

text
Problem -> Gap -> Main idea -> Core evidence -> Supporting evidence -> Boundary / limitations

Phase 4: 明确什么不写

论文结构规划最重要的删减动作包括:

  • 不把 UNSUPPORTED 的 claim 留在摘要和引言里
  • 不把 WEAKLY_SUPPORTED 的 claim 写成主 claim
  • 不把与 paper question 无关的额外结果塞进正文
  • 不把 reviewer 已指出站不住的表述继续保留

很多结构问题不是因为缺内容,而是因为保留了不该保留的内容。

一个补充的 Claims-Evidence Matrix 结构图(LaTeX/TikZ)

如果你想在本章放一张更直接表达“claim -> evidence -> 论文位置”关系的图,可以直接使用下面的 LaTeX 代码:

Claims-Evidence Matrix aligns each claim with concrete evidence and then maps that evidence into paper sections and figures.
Claims-Evidence Matrix aligns each claim with concrete evidence and then maps that evidence into paper sections and figures.

使用时需要:

latex
\usepackage{tikz}
\usetikzlibrary{positioning,arrows.meta}

Phase 5: 写成 PAPER_PLAN.md

PAPER_PLAN.md 不该只是“目录草稿”,而应至少回答:

  • 这篇 paper 的核心问题是什么
  • 主打 claim 是什么,哪些 claim 只作辅助
  • 每一节要完成的论证任务是什么
  • 哪些结果进正文,哪些进附录
  • 标题、摘要和引言允许说到什么强度

PAPER_PLAN.md 模板

markdown
# Paper Plan

## Paper Question
- One-sentence paper question:
- Target venue:

## Claim Hierarchy
- Core claim:
- Supporting claims:
- Boundary claims:

## Main Narrative
1. Problem and why it matters
2. Gap in prior work
3. Main idea
4. Core evidence
5. Supporting evidence
6. Boundary / limitations

## Section Plan

| Section | Purpose | Key claim | Required evidence |
|---------|---------|-----------|-------------------|
| Intro | ... | ... | ... |
| Method | ... | ... | ... |
| Experiments | ... | ... | ... |

## Include / Exclude Decisions
- Must include:
- Move to appendix:
- Remove:

## Writing Constraints
- Claims that can appear in title / abstract:
- Claims that must be weakened:
- Claims that should not appear:

CLAIMS_EVIDENCE_MATRIX.csv 示例

markdown
| claim_id | claim_text | strength | evidence | location | status | risk_note |
|----------|------------|----------|----------|----------|--------|-----------|
| C1 | Our method improves ... under ... | strong | Table 1, Fig. 2 | title, abstract, intro, exp | supported | closest work baseline remains strongest challenge |
| C2 | The gain mainly comes from ... | medium | Ablation Table 3 | intro, exp, discussion | weak | mechanism evidence still limited |
| C3 | The method fails on ... | weak | Failure analysis Fig. 5 | discussion | supported | should not be overgeneralized |

工具接入建议

这一章更适合吸收 附录 D 里“任务契约、结构化写作输入和审稿前规划”的经验:

工具 / 来源更适合做什么不要直接拿来做什么
ARIS paper planning / review flow把 review 后的 claim 和 evidence 压成结构化计划代替你决定论文主线
AI-research-SKILLs用任务分解方式组织 section purpose 和 handoff直接产出未经审核的最终结构
Anthropic Skills 风格 contract强化输入、输出、review gate 的写法用形式化模板掩盖研究主线不清

这里强调的是从 agent / skill 框架提炼出来的可执行结构规划方式,而不是传统“先写 introduction 再想实验怎么放”的倒序写法。

质量控制

1. 标题、摘要、引言只能写最稳的 claim

越靠前的位置,claim 强度要求越高。

2. 矩阵必须先于写作

先有 CLAIMS_EVIDENCE_MATRIX.csv,再开始大规模写正文。

3. 每一节都要有论证任务

“这一节要放什么”不是任务;“这一节要说服读者什么”才是任务。

4. 附录不是垃圾桶

放进附录的内容也应服务主线,只是优先级较低。

5. 删减和降强度同样重要

把不该写的 claim 删掉,往往比多写一节更重要。

常见错误

错误 1:先列目录,后找证据

表现:目录很好看,但每节没有稳定证据支撑。

解决:先做 claim-evidence matrix,再定结构。

错误 2:把所有结果都塞进正文

表现:正文又长又散,主线不清。

解决:核心 claim 的 strongest evidence 才进主线,其余降级到附录或删除。

错误 3:弱 claim 写得太强

表现WEAKLY_SUPPORTED 的发现进入标题和摘要。

解决:按 matrix 的 statusstrength 控制位置。

错误 4:章节顺序服从习惯,不服从论证

表现:结构看起来规范,但读者无法自然接受主 claim。

解决:用“先解决哪一个读者疑问”来决定顺序。

错误 5:review 已指出的问题还留在主线里

表现:明明有 unresolved criticism,却还在摘要中高强度表述。

解决:回看 REVIEW_LOOP_LOG.md,删除或降级未解决 claim。

检查清单

完成本章后,你应至少能回答:

问题状态
我是否已经明确 paper question 和 core claim?[]
我是否为每条 visible claim 指定了具体 evidence 和 location?[]
我是否区分了正文、附录和不写内容?[]
我是否知道哪些 claim 可以进标题和摘要?[]
我是否准备好把结构交给图表与写作章节?[]

小结

论文结构规划的关键不是“写出一个目录”,而是:

  1. 选出真正能站住的 claim 层级
  2. 建立 CLAIMS_EVIDENCE_MATRIX.csv
  3. 用证据和读者疑问反推章节顺序
  4. 写出 PAPER_PLAN.md
  5. 明确哪些该写、弱写、不写

下一步:10-图表制作 - 把 claim-evidence 关系转成 figure spec


引用 ARIS:本章的 claim 收敛、review 后结构重组和 paper planning 思路主要来自 ARIS 的 paper 流程。

扩展来源:这一版还吸收了 AI-research-SKILLs 与 Anthropic Skills 风格任务契约中的输入输出设计经验。完整来源见:附录 D