Umi-OCR:免费,开源,可批量的离线OCR工具
作者:啊哈哈哈 来源:08论坛 时间:2025-04-11 15:30:11
Umi-OCR是什么?
Umi-OCR 是一款基于百度的 PaddleOCR 框架开发的开源、免费的离线OCR 工具,支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码,内置多国语言库等功能,具有高精度识别、离线运行、多语言支持、高效批处理等优势。
Umi-OCR功能特点
离线运行:完全离线使用,无需网络连接,保护用户隐私。
多语言支持:内置多国语言库,支持多种语言的文字识别。
多种识别功能:
截图 OCR:支持屏幕截图、粘贴图片进行文字识别。
批量 OCR:可批量导入图片进行文字识别,支持多种图片格式。
PDF 识别:支持从 PDF 文档中提取文字,可排除页眉、页脚等。
二维码识别:支持扫码和生成二维码。
公式识别:支持数学公式识别(测试中)。
文本后处理:支持对识别结果进行排版整理,排除干扰文字。
灵活调用:支持命令行和 HTTP 接口调用,方便开发者集成。
Umi-OCR技术特性
高精度识别:内置多种语言模型,支持简/繁中文、英文、日文、韩文及常见欧洲语言,兼容混合排版文本识别。
复杂版式解析:精准识别竖排文字、表格和简单数学公式。
低质量图像优化:针对模糊、倾斜、低光照图片进行预处理,提升识别准确率。
高效批处理与灵活输出:支持拖拽文件夹或批量导入图片,一键完成数百文件的OCR识别。
Umi-OCR使用场景
办公场景:快速提取扫描版PDF、图片报告中的文字,转换为可编辑文档。
学术研究:识别外文文献、古籍资料,辅助翻译与引用。
多媒体处理:为视频截图、漫画翻译、游戏字幕提供文字提取支持。
自动化流程:通过命令行接口集成到其他工具链,实现批量OCR自动化。
Umi-OCR下载与使用
下载链接:
蓝奏云(国内推荐,免注册/无限速):https://hiroi-sora.lanzoul.com/s/umi-ocr
GitHub Release:https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.4
安装方式:解压即用,无需安装。支持Windows 7 x64和Linux x64平台。
命令行安装:通过Scoop安装(Windows):
scoopinstallextras/umi-ocr未来计划
重构底层插件机制。
添加在线OCR API插件。
实现独立的数学公式识别插件。
支持图片翻译和离线翻译。
兼容MacOS和更多Linux发行版
前两天介绍的一个olmOCR也不错,只要测重PDF的转换,也可以试下。
- 上一篇: iPhone快捷指令设置教程大全手册
更多资讯
热门文章
推荐对话
换一换- 人气排行
- 1 Umi-OCR:免费,开源,可批量的离线OCR工具
- 2 iPhone快捷指令设置教程大全手册
- 3 MTranServer:一个超低资源消耗超快的离线翻译服务器开源项目
- 4 Mahilo:一款AI多智能体人机协作框架,适合紧急响应、客户服务和团队协作
- 5 即梦AI生成数字人教程指南,让图片“活过来”
- 6 Markdownify-MCP:能将多种文件类型和网页内容转换为Markdown格式
- 7 ComfyUI-RMBG: 完美人物抠图,背景移除,精准识别分割
- 8 你知道字节跳动有哪些AI产品吗?
- 9 STORM:斯坦福大学开源的写作助手,通过检索和多角度提问来整理知识。
- 10 智谱清言长文档解读的功能介绍及用法