跳转至

research-note-capture

所属包: research

阅读摘录与证据笔记捕获:从PDF/DOC/网页提取关键原文,记录出处位置(page/section/paragraph)、paraphrase与why_it_matters,支持“先摘录不要总结”“读文献摘重点”。Use when users ask “阅读笔记/reading notes/摘录重点/passages/quote capture/excerpt notes” before synthesis, with traceable source_id and location.

兼容性: opencode


作用/Purpose

把阅读过程沉淀为可追溯证据笔记,保障“原文—位置—解释—用途”链条完整,为后续证据账本与结论写作提供基础。

触发场景/Trigger Scenarios

  • 用户说“帮我读这篇文章并摘录重点”。
  • 用户要求记录“有价值的原文和出处”。
  • 用户上传 PDF/DOC/网页并要求阅读笔记。
  • 用户明确要求“先摘录,不要太快总结”。
  • 阅读中发现关键定义、数据、方法或判断依据。

输入/Input

  • source_id 与来源元信息。
  • 文本载体与访问信息(版本、访问方式、页码/章节能力)。
  • 研究问题或关注标签(可选)。

输出/Output

  • excerpt-notes.jsonl
  • reading-notes/SRC-XXXXXX.md
  • quote-bank.md

工作流/Workflow

  1. 确认 source_id 与版本信息。
  2. 记录访问方式与可追溯元数据。
  3. 按章节/主题分块阅读。
  4. 抽取关键原文片段。
  5. 记录位置(page/section/paragraph)。
  6. 编写 paraphrase(转述,不改写原意)。
  7. 编写 why_it_matters(与研究问题的关联)。
  8. 添加 tagsrelated_questions
  9. 可选同步至 quote-bank.md
  10. 如摘录支持正式主张,移交至 research-evidence-ledger
  11. 使用 note_lint.py 做记录规范检查,并参照 excerpt-note-method.mdexcerpt-notes-empty.jsonlreading-note-template.md

Schema

excerpt-notes.jsonl 每行一个 JSON 对象,字段如下:

Required fields

  • note_id (string): pattern NOTE-\d+
  • source_id (string): non-empty
  • original_text (string): non-empty
  • location (object): at least one key (e.g. {"page": 5, "section": "3.1"})

Optional / recommended fields (warnings if missing)

  • paraphrase (string)
  • why_it_matters (string)
{"note_id":"NOTE-89","source_id":"SRC-120045","original_text":"Index staleness strongly correlates with retrieval errors in weekly release cycles.","location":{"page":5,"section":"3.1"},"paraphrase":"Weekly release cadence may require more frequent index refresh to avoid stale retrieval.","why_it_matters":"Directly informs refresh policy design for the target system."}

参考资料/References

  • references/excerpt-note-method.md — 摘录笔记方法论与最佳实践
  • assets/reading-note-template.md — 阅读笔记Markdown模板
  • assets/excerpt-notes-empty.jsonl — 空的JSONL模板,可直接复制使用
  • scripts/note_lint.py — 笔记格式校验脚本,运行方式: uv run note_lint.py --input <path>

质量门禁/Quality Gates

  • 每条摘录必须有 source_id
  • 直接引用必须有精确位置。
  • 必须区分 original_textparaphrase
  • 每条摘录必须有 why_it_matters
  • 不得整篇复制原文进入笔记。
  • 不得把摘要伪装成原始证据。

Gotchas/注意事项

  • 摘录阶段不做综合结论。
  • 转述要忠实原意,避免主观增删。
  • 位置字段缺失会导致证据不可复核。
  • 片段要“最小充分”,避免冗长抄录。