主题
09 - 论文结构
用 claim-evidence 组织论文
目标
论文结构不是“先列一个目录”,而是回答:
当前这组 claim 和 evidence,应该怎样组织,才能既真实又有说服力?
本章的目标是:
- 把前面章节的研究产物压缩成一份
PAPER_PLAN.md - 为每条准备写进论文的 claim 建立
CLAIMS_EVIDENCE_MATRIX.csv - 明确主 claim、支持 claim、边界条件和不该写的内容
- 决定章节顺序、主叙事线和目标 venue 约束
- 给 10-图表制作 和 11-写作与润色 提供稳定输入
本章回答的问题是:
哪些话可以写进标题、摘要和引言,哪些只能放结果里弱说,哪些必须删掉?
完成标准
完成本章,不等于“我有一个论文目录”,而是至少做到:
- 你有一份经过人类复核的
PAPER_PLAN.md - 你有一份
CLAIMS_EVIDENCE_MATRIX.csv - 每个核心 claim 都能映射到具体证据和论文位置
- 你明确知道哪些结果进主线,哪些进补充,哪些不写
- 你能把结构交给图表和写作章节继续消费
输入与标准产物
输入
建议直接使用 01-08 章的关键产物:
| 输入 | 作用 |
|---|---|
PROBLEM_NOTE.md | 保持论文仍然服务原始问题 |
NOVELTY_REPORT.md | 回看 claim 级定位和 closest work 风险 |
ANALYSIS_REPORT.md | 提供当前最可信的 findings 和 claim 状态 |
REVIEW_LOOP_LOG.md | 提供哪些 criticism 已解决、哪些仍需规避 |
| 目标 venue 要求 | 约束页数、结构、实验深度和写作风格 |
| 当前图表草稿 / 表格草稿 | 帮助判断叙事是否有足够支撑 |
标准产物
| 产物 | 作用 | 后续会在哪用到 |
|---|---|---|
PAPER_PLAN.md | 规划论文核心主张、结构和叙事顺序 | 10, 11, 12 |
CLAIMS_EVIDENCE_MATRIX.csv | 把 claim、证据、位置和状态对齐 | 10, 11 |
这些 artifact 的统一命名、建议路径和状态定义见:附录 E
人类-智能体协作
| 阶段 | 智能体适合做什么 | 人必须负责什么 | 常见风险 |
|---|---|---|---|
| 结构草拟 | 根据 claim 和 finding 起草章节大纲 | 决定真正的主线和删减原则 | 把所有结果都塞进主线 |
| 矩阵整理 | 建立 claim-evidence-location 映射表 | 判断证据是否真的足够 | 把弱证据也标成已支撑 |
| venue 对齐 | 汇总目标会议的格式和篇幅约束 | 决定取舍和压缩策略 | 为迎合版式牺牲论证完整性 |
| 风险预审 | 指出 claim 过强、证据不足和结构断裂 | 对标题、摘要和引言的强度签字 | 用漂亮叙事掩盖证据空洞 |
本章默认的工作方式是:
智能体可以帮你搭结构、填矩阵、找断裂点;人类必须决定论文到底要主打什么。
论文结构不是什么
这一章不是在做:
- 标准五段式模板套填
- 先写目录再希望数据自己适配
- 把所有跑过的实验都塞进正文
- 用更强的文字掩盖更弱的证据
论文结构的本质是:
给每个准备公开声称的 claim 分配合适的证据位置和表述强度。
工作流
Phase 0: 先冻结 paper question
在规划结构前,先回答一件事:
如果读者读完整篇论文,只能记住一句话,你希望他记住什么?
这句话通常来自三者交集:
PROBLEM_NOTE.md里的核心问题NOVELTY_REPORT.md里最站得住的差异点ANALYSIS_REPORT.md里最可信的 evidence
如果这三者对不上,先不要写结构,回去修正主线。
Phase 1: 划分 claim 层级
建议把准备写进论文的 claim 只分成三层:
| 层级 | 作用 |
|---|---|
| Core claim | 标题、摘要、引言和结论都要服务的主张 |
| Supporting claim | 用来补强方法有效性、机制或边界 |
| Boundary claim | 用来说明方法在哪些条件下成立或失效 |
通常一篇 paper 最好只有:
- 1 个 core claim
- 2-4 个 supporting claims
- 若干 boundary claims
如果 core claim 超过 2 个,结构通常已经开始分叉。
Phase 2: 建立 CLAIMS_EVIDENCE_MATRIX.csv
这是本章最关键的动作。
建议对每条 claim 至少写清:
| 字段 | 说明 |
|---|---|
claim_id | claim 编号 |
claim_text | 准备写出的 claim |
strength | strong / medium / weak |
evidence | 支撑该 claim 的实验、图、表或分析 |
location | 摘要 / 引言 / 方法 / 实验 / 讨论 / 补充材料 |
status | supported / weak / unsupported |
risk_note | 最可能被 reviewer 攻击的点 |
规则很简单:
没有证据位置的 claim,不应出现在标题、摘要和引言。
Phase 3: 用证据反推章节顺序
不要按“大家都这么写”的惯性决定结构,而应反问:
- 读者要先知道什么背景,才会接受这个问题重要?
- 读者要看到什么 closest work,才会理解差异点?
- 读者要先看到哪一组实验,才会相信 core claim?
- 哪些诊断和边界结果应放正文,哪些应放附录?
对多数 AI/ML 论文,合理顺序通常是:
text
Problem -> Gap -> Main idea -> Core evidence -> Supporting evidence -> Boundary / limitationsPhase 4: 明确什么不写
论文结构规划最重要的删减动作包括:
- 不把
UNSUPPORTED的 claim 留在摘要和引言里 - 不把
WEAKLY_SUPPORTED的 claim 写成主 claim - 不把与 paper question 无关的额外结果塞进正文
- 不把 reviewer 已指出站不住的表述继续保留
很多结构问题不是因为缺内容,而是因为保留了不该保留的内容。
一个补充的 Claims-Evidence Matrix 结构图(LaTeX/TikZ)
如果你想在本章放一张更直接表达“claim -> evidence -> 论文位置”关系的图,可以直接使用下面的 LaTeX 代码:
使用时需要:
latex
\usepackage{tikz}
\usetikzlibrary{positioning,arrows.meta}Phase 5: 写成 PAPER_PLAN.md
PAPER_PLAN.md 不该只是“目录草稿”,而应至少回答:
- 这篇 paper 的核心问题是什么
- 主打 claim 是什么,哪些 claim 只作辅助
- 每一节要完成的论证任务是什么
- 哪些结果进正文,哪些进附录
- 标题、摘要和引言允许说到什么强度
PAPER_PLAN.md 模板
markdown
# Paper Plan
## Paper Question
- One-sentence paper question:
- Target venue:
## Claim Hierarchy
- Core claim:
- Supporting claims:
- Boundary claims:
## Main Narrative
1. Problem and why it matters
2. Gap in prior work
3. Main idea
4. Core evidence
5. Supporting evidence
6. Boundary / limitations
## Section Plan
| Section | Purpose | Key claim | Required evidence |
|---------|---------|-----------|-------------------|
| Intro | ... | ... | ... |
| Method | ... | ... | ... |
| Experiments | ... | ... | ... |
## Include / Exclude Decisions
- Must include:
- Move to appendix:
- Remove:
## Writing Constraints
- Claims that can appear in title / abstract:
- Claims that must be weakened:
- Claims that should not appear:CLAIMS_EVIDENCE_MATRIX.csv 示例
markdown
| claim_id | claim_text | strength | evidence | location | status | risk_note |
|----------|------------|----------|----------|----------|--------|-----------|
| C1 | Our method improves ... under ... | strong | Table 1, Fig. 2 | title, abstract, intro, exp | supported | closest work baseline remains strongest challenge |
| C2 | The gain mainly comes from ... | medium | Ablation Table 3 | intro, exp, discussion | weak | mechanism evidence still limited |
| C3 | The method fails on ... | weak | Failure analysis Fig. 5 | discussion | supported | should not be overgeneralized |工具接入建议
这一章更适合吸收 附录 D 里“任务契约、结构化写作输入和审稿前规划”的经验:
| 工具 / 来源 | 更适合做什么 | 不要直接拿来做什么 |
|---|---|---|
| ARIS paper planning / review flow | 把 review 后的 claim 和 evidence 压成结构化计划 | 代替你决定论文主线 |
| AI-research-SKILLs | 用任务分解方式组织 section purpose 和 handoff | 直接产出未经审核的最终结构 |
| Anthropic Skills 风格 contract | 强化输入、输出、review gate 的写法 | 用形式化模板掩盖研究主线不清 |
这里强调的是从 agent / skill 框架提炼出来的可执行结构规划方式,而不是传统“先写 introduction 再想实验怎么放”的倒序写法。
质量控制
1. 标题、摘要、引言只能写最稳的 claim
越靠前的位置,claim 强度要求越高。
2. 矩阵必须先于写作
先有 CLAIMS_EVIDENCE_MATRIX.csv,再开始大规模写正文。
3. 每一节都要有论证任务
“这一节要放什么”不是任务;“这一节要说服读者什么”才是任务。
4. 附录不是垃圾桶
放进附录的内容也应服务主线,只是优先级较低。
5. 删减和降强度同样重要
把不该写的 claim 删掉,往往比多写一节更重要。
常见错误
错误 1:先列目录,后找证据
表现:目录很好看,但每节没有稳定证据支撑。
解决:先做 claim-evidence matrix,再定结构。
错误 2:把所有结果都塞进正文
表现:正文又长又散,主线不清。
解决:核心 claim 的 strongest evidence 才进主线,其余降级到附录或删除。
错误 3:弱 claim 写得太强
表现:WEAKLY_SUPPORTED 的发现进入标题和摘要。
解决:按 matrix 的 status 和 strength 控制位置。
错误 4:章节顺序服从习惯,不服从论证
表现:结构看起来规范,但读者无法自然接受主 claim。
解决:用“先解决哪一个读者疑问”来决定顺序。
错误 5:review 已指出的问题还留在主线里
表现:明明有 unresolved criticism,却还在摘要中高强度表述。
解决:回看 REVIEW_LOOP_LOG.md,删除或降级未解决 claim。
检查清单
完成本章后,你应至少能回答:
| 问题 | 状态 |
|---|---|
| 我是否已经明确 paper question 和 core claim? | [] |
| 我是否为每条 visible claim 指定了具体 evidence 和 location? | [] |
| 我是否区分了正文、附录和不写内容? | [] |
| 我是否知道哪些 claim 可以进标题和摘要? | [] |
| 我是否准备好把结构交给图表与写作章节? | [] |
小结
论文结构规划的关键不是“写出一个目录”,而是:
- 选出真正能站住的 claim 层级
- 建立
CLAIMS_EVIDENCE_MATRIX.csv - 用证据和读者疑问反推章节顺序
- 写出
PAPER_PLAN.md - 明确哪些该写、弱写、不写
下一步:10-图表制作 - 把 claim-evidence 关系转成 figure spec
引用 ARIS:本章的 claim 收敛、review 后结构重组和 paper planning 思路主要来自 ARIS 的 paper 流程。
扩展来源:这一版还吸收了 AI-research-SKILLs 与 Anthropic Skills 风格任务契约中的输入输出设计经验。完整来源见:附录 D