pi-local-ocr 扩展的设计过程

为没有 vision 能力的模型做了一个本地 OCR 扩展，让模型通过 EasyOCR 读取图片中的文字和表格。

关键决策

决策	选择	原因
Extension vs Skill	Extension	20 token vs 500 token 上下文污染，TypeBox 参数校验，零幻觉
EasyOCR vs PaddleOCR	EasyOCR	PaddleOCR 预编译二进制要求 AVX512，本机 SIGILL 崩溃
表格重建方式	坐标聚类	EasyOCR 无原生表格识别，用 y 坐标分组行 + x 坐标排序列补偿
语言栈	Python subprocess	中文 OCR 的最强生态在 Python，Node.js 无可用方案

调研了四层才确认空白：

所有有外部依赖的工具都应该用 extension。

PaddleOCR 的 PP-Structure 很牛，但 SIGILL 崩溃 — 要求 AVX512。EasyOCR 功能稍逊，但任何 x86 CPU 都能跑。

pi install git:github.com/CNCSMonster/pi-local-ocr
bash ~/.pi/agent/git/github.com/CNCSMonster/pi-local-ocr/scripts/setup.sh