能否识别PDF文件呢？ #92

chengyuyu · 2024-01-17T08:11:02Z

原版的PaddleOCR可以识别PDF文件，能否增加对pdf文件的图片内容的识别呢？

hiroi-sora · 2024-01-17T15:16:10Z

Umi-OCR 正在开发PDF识别功能。PDF解析部分将由Umi本身而不是PaddleOCR引擎负责。PaddleOCR-json 暂时没有更新计划。

yangyunlv · 2024-03-15T02:54:39Z

为啥我用Umi-OCR打印识别结果的时候比这里多出了两个'from': 'text', 'end': ''，是这边的版本还没更新吗

hiroi-sora · 2024-03-15T03:00:19Z

是这边的版本还没更新吗

PDF解析部分由Umi-OCR中的组件负责。这边 PaddleOCR-json 是单纯的OCR引擎，没有PDF解析功能。

"from" 和 "end" 也是 Umi 的解析结果，与 Paddle 无关。

hiroi-sora closed this as completed Jun 4, 2024

Provide feedback