Skip to content

D - AI/ML 自动化科研来源与工具地图

从开源自动化科研项目和 agent skills 中提炼经验,也给读者提供可单独运行的工具入口

这张地图怎么用

这份附录不是“项目收藏夹”,而是一本 AI/ML 研究手册的来源索引

使用方式:

  1. 当你准备扩写某一章时,先看哪些来源最相关
  2. 优先提炼可迁移的流程、检查项和产物
  3. 不要把某个项目的 prompt 或 API 细节直接写成“通用原则”
  4. 始终补上“哪些地方必须由人复核”

来源矩阵

来源类型适合补充的章节可提炼经验注意事项
ARIS端到端自动科研 workflow01-13阶段拆分、产物契约、自动审稿循环、状态沉淀是当前第一来源,但不应成为唯一来源
Research-Paper-Writing-Skills写作方法论09-12论文结构、写作顺序、rebuttal 模板更偏人工写作,不是自动化系统
claude-scholar引用验证协议02, 04, 11引用核验、证据归因、降低误引风险更适合做引用规范,而不是通用检索框架
The AI Scientist自动科研系统03, 05, 08, 11idea→experiment→paper→review 闭环、并行试错、自动审稿更适合代码可执行的研究任务
PaSa学术论文检索 agent02, 04复杂 scholarly query 的多轮检索、读论文、筛相关参考文献适合扩展检索广度和召回,不直接替代人工相关性判断
Open Deep Research深度研究 agent02, 04多轮检索、任务分解、结构化研究报告适合作为调研助手,不直接替代新颖性判断
GPT Researcher自主 deep research agent02, 04, 11主题调研、报告生成、资料归档输出应视为草稿,仍需人工核证
STORM带引用的知识整理系统02, 09, 11主题拆分、带引用综述、写作前知识组织更适合 pre-writing 阶段,不直接等于可投稿正文
PaperQA2文献问答系统02, 04, 11基于 PDF/文献库的问答、证据定位、引用支撑很适合做 claim cross-check
Scholar QA文献综述与问答系统02, 04大规模检索、长程证据整合、学术问答更适合补充调研广度
HypoGeniC / hypothesis-generation假设生成系统03, 07从数据和观察生成候选假设、比较假设质量适合作为想法发生器,不适合直接当结论
Anthropic Skills通用 skill 设计仓库全书输入输出契约、可复用任务封装方式、skill 候选提升规则偏通用 skill 设计,不是科研专用
AI-research-SKILLs研究型 skills 集合02, 03, 05, 08, 13把研究任务拆成可重复调用的技能单元,并沉淀为可复用资产需要筛选哪些 skill 真正稳定可迁移

可单独运行的工具项目

1. Idea 发现与假设生成

项目适合输入适合输出适合本书中的位置
The AI Scientist明确的任务边界、可运行 baseline候选想法、实验计划、初稿03-想法生成, 05-实验设计, 08-自动迭代循环
HypoGeniC / hypothesis-generation观察、实验结果、现象描述候选假设及排序03-想法生成, 07-结果分析

2. 检索、综述与新颖性验证

项目强项适合输出适合本书中的位置
PaSa复杂学术 query 的 agentic 检索与候选论文筛选候选论文池、相关参考文献、扩展检索结果02-文献调研, 04-新颖性验证
Open Deep Research多轮检索和规划深度研究报告、问题分解02-文献调研, 04-新颖性验证
GPT Researcher自主研究和报告生成主题综述、资料汇编02-文献调研
STORM带引用的知识组织写作前背景综述02-文献调研, 09-论文结构
PaperQA2基于文献库的问答与引用定位claim 支撑、证据片段、对比问答04-新颖性验证, 11-写作与润色
Scholar QA检索和长上下文学术问答文献整合问答、背景比较02-文献调研, 04-新颖性验证

3. 审稿、质检与写作支撑

项目更适合做什么不应直接替代什么
ARIS 中的 research-review / auto-review-loop审稿模拟、问题分级、迭代记录真实专家审稿
The AI Scientist自动生成论文和 review 信号最终投稿前的人类把关
PaperQA2检查 claim 是否有文献支撑作者对论断强度的最终判断
claude-scholar引用核验协议全部写作决策

4. 作为“来源”而不是“工具”的 skill 仓库

这些仓库不一定直接跑出论文,但非常适合拿来提炼“任务契约”:

仓库适合提炼什么
Anthropic Skillsskill 的输入输出、复用边界、失败回退
AI-research-SKILLs科研任务拆分、角色提示、执行顺序
ARIS skillsAI/ML 研究任务的阶段化技能设计

建议优先纳入正文的路线

第一优先级

  1. 02-文献调研

    • 引入 PaSa、Open Deep Research、GPT Researcher、STORM、PaperQA2 的工作方式
    • 把“单篇读论文”扩展成“多轮检索 + 归纳 + 引用归因”
  2. 03-想法生成

    • 引入 The AI Scientist、HypoGeniC
    • 把“头脑风暴”扩展成“候选想法池 + 排名 + 淘汰记录”
  3. 04-新颖性验证

    • 引入 PaperQA2、Scholar QA
    • 把“搜索过没有”扩展成“claim 级别的新颖性对比”

第二优先级

  1. 08-自动迭代循环

    • 对照 ARIS 和 The AI Scientist
    • 增强“反馈解析、修复决策、循环停止条件”
  2. 11-写作与润色

    • 引入 citation-grounded QA 和作者化审校
    • 强化“作者责任、引用核验、claim-evidence 对齐”

第三优先级

  1. 附录 A

    • 增加这些项目的本地接入方式和适用边界
  2. 13-复盘与资产化

    • 把项目沉淀成 skill、模板、失败案例和标准产物

纳入这些来源时的原则

  1. 提炼流程,不照抄 prompt
  2. 提炼稳定产物,不绑定特定模型
  3. 明确 agent 能做什么,也明确人必须复核什么
  4. 优先写“适用边界”和“失败模式”

这张地图的目的不是追新,而是帮助这本书持续吸收 AI/ML 自动化科研中的稳定经验。