research-note-capture¶
Pack: research
阅读摘录与证据笔记捕获:从PDF/DOC/网页提取关键原文,记录出处位置(page/section/paragraph)、paraphrase与why_it_matters,支持“先摘录不要总结”“读文献摘重点”。Use when users ask “阅读笔记/reading notes/摘录重点/passages/quote capture/excerpt notes” before synthesis, with traceable source_id and location.
Compatibility: opencode
作用/Purpose¶
把阅读过程沉淀为可追溯证据笔记,保障“原文—位置—解释—用途”链条完整,为后续证据账本与结论写作提供基础。
触发场景/Trigger Scenarios¶
- 用户说“帮我读这篇文章并摘录重点”。
- 用户要求记录“有价值的原文和出处”。
- 用户上传 PDF/DOC/网页并要求阅读笔记。
- 用户明确要求“先摘录,不要太快总结”。
- 阅读中发现关键定义、数据、方法或判断依据。
输入/Input¶
source_id与来源元信息。- 文本载体与访问信息(版本、访问方式、页码/章节能力)。
- 研究问题或关注标签(可选)。
输出/Output¶
excerpt-notes.jsonlreading-notes/SRC-XXXXXX.mdquote-bank.md
工作流/Workflow¶
- 确认
source_id与版本信息。 - 记录访问方式与可追溯元数据。
- 按章节/主题分块阅读。
- 抽取关键原文片段。
- 记录位置(page/section/paragraph)。
- 编写
paraphrase(转述,不改写原意)。 - 编写
why_it_matters(与研究问题的关联)。 - 添加
tags与related_questions。 - 可选同步至
quote-bank.md。 - 如摘录支持正式主张,移交至
research-evidence-ledger。 - 使用
note_lint.py做记录规范检查,并参照excerpt-note-method.md、excerpt-notes-empty.jsonl、reading-note-template.md。
Schema¶
excerpt-notes.jsonl 每行一个 JSON 对象,字段如下:
Required fields
note_id(string): patternNOTE-\d+source_id(string): non-emptyoriginal_text(string): non-emptylocation(object): at least one key (e.g.{"page": 5, "section": "3.1"})
Optional / recommended fields (warnings if missing)
paraphrase(string)why_it_matters(string)
{"note_id":"NOTE-89","source_id":"SRC-120045","original_text":"Index staleness strongly correlates with retrieval errors in weekly release cycles.","location":{"page":5,"section":"3.1"},"paraphrase":"Weekly release cadence may require more frequent index refresh to avoid stale retrieval.","why_it_matters":"Directly informs refresh policy design for the target system."}
参考资料/References¶
references/excerpt-note-method.md— 摘录笔记方法论与最佳实践assets/reading-note-template.md— 阅读笔记Markdown模板assets/excerpt-notes-empty.jsonl— 空的JSONL模板,可直接复制使用scripts/note_lint.py— 笔记格式校验脚本,运行方式:uv run note_lint.py --input <path>
质量门禁/Quality Gates¶
- 每条摘录必须有
source_id。 - 直接引用必须有精确位置。
- 必须区分
original_text与paraphrase。 - 每条摘录必须有
why_it_matters。 - 不得整篇复制原文进入笔记。
- 不得把摘要伪装成原始证据。
Gotchas/注意事项¶
- 摘录阶段不做综合结论。
- 转述要忠实原意,避免主观增删。
- 位置字段缺失会导致证据不可复核。
- 片段要“最小充分”,避免冗长抄录。