Skip to content

ppt-reader

Pack: ppt

Read/inspect/summarize/audit/compare PPT/PPTX, extract slide inventory (titles, structure, notes, comments, media, links), review templates/layout/placeholders/sensitive info, or produce rewrite briefs and per-slide action plans for ppt-writer. Trigger for 读取/总结/审阅/对比课件、提案、汇报材料 and visual QA requests.

Compatibility: opencode; requires uv for bundled Python scripts; optional LibreOffice and Poppler for slide rendering.


PPT Reader Skill

目标

把PPT/PPTX从“不可控的二进制文件”转化为可审查、可引用、可改写的结构化材料。默认输出不是简单抽取全文,而是形成可继续加工的slide inventory。

适用任务:

  • 读取、总结、审阅、对比PPT/PPTX。
  • 从课件、提案、汇报材料中抽取大纲、讲解逻辑、章节结构、页标题、备注、图片占位和媒体清单。
  • 为后续ppt-writer提供重写计划、改版建议、逐页修改清单。
  • 检查模板、版式、残留占位符、外部链接、空页、备注内容和潜在敏感信息。

不适用任务:

  • 从零创建新PPT;使用ppt-writer
  • 大规模批量转换文档;先编写专门批处理脚本或workflow。
  • 对扫描图片中文字做高可靠OCR;仅在用户明确要求时再引入OCR工具。

默认工作流

  1. 确认输入文件路径和目标产物。如果用户没有指定输出格式,默认输出Markdown摘要,并保留JSON结构化结果。
  2. 先运行结构化抽取:
uv run scripts/pptx_extract.py input.pptx --out output/pptx_inventory.json --markdown output/pptx_summary.md
  1. 读取输出JSON,形成以下分析:
  2. 全局:文件名、页数、标题候选、是否含备注、是否含外部链接、是否有疑似占位符。
  3. 逐页:页码、标题候选、正文要点、备注、图片/媒体、评论、异常。
  4. 叙事结构:总-分-总、问题-分析-方案、背景-挑战-方法-验证等结构是否清晰。
  5. 后续动作:哪些页需要合并、拆分、重写、补图、补数据、改标题。
  6. 如果用户要求视觉审阅、模板审阅、排版问题或“看起来怎么样”,再渲染为图片:
uv run scripts/render_slides.py input.pptx --out output/rendered --resolution 150
  1. 用渲染图做视觉检查:重叠、溢出、低对比度、过密、页边距不足、视觉元素缺失、字体不一致、图表无法读清。

输出格式建议

简短摘要

# PPT读取摘要:[文件名]

## 一句话结论
[整体判断]

## 结构概览
| 页码 | 标题候选 | 主要内容 | 备注/媒体 | 问题 |
|---|---|---|---|---|

## 主要发现
1. [发现]
2. [发现]

## 后续建议
- [建议]

逐页审阅

## Slide [N]:[标题候选]

- 内容:
- 备注:
- 媒体/图片:
- 版式观察:
- 风险或问题:
- 建议动作:保留 / 重写 / 拆分 / 合并 / 补图 / 删除

为ppt-writer准备的改版brief

```markdown

PPT改版Brief

... (36 more lines in full SKILL.md)