软件简介
Umi-OCR是一款开源、免费且功能强大的离线文字识别工具,基于先进的离线OCR引擎开发,能够高效地将图片和文档中的文字内容提取为可编辑文本。它支持多种图片格式(如 JPEG、PNG、BMP 等)和 PDF 文档的识别,并可将识别结果导出为 TXT、MD、JSONL 等多种格式。软件内置简体中文和英文识别库,还可通过扩展包支持繁体中文、日文、韩文、俄文、德文、法文等多种语言。其界面简洁易用,即使是 OCR 初学者也能快速上手。此外,Umi-OCR 提供了丰富的高级功能,如截图识别、批量处理、忽略区域设置、二维码识别与生成等,能够满足用户在不同场景下的文字识别需求。文章源自电脑天空-https://www.dntk.top/7295.html
更新内容
- 新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。指定级别以上(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
- 新增:大部分标签页能手动切换左右/上下双栏模式。
- 新增:Esc键隐藏主窗口。
- 新增:调整二维码生成相关参数后,自动刷新二维码生成。
- 新增:命令行指令 --reload ,用于重新加载配置文件。
- 修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。
- 修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
- 修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
- 修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
- 修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
- 修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。
- 修复:Linux版本截图后,主窗口的位置与操作前不一致。
- 优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。
- Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
- 新增UI语言:俄语 、泰米尔语。
下载地址
夸克网盘:文章源自电脑天空-https://www.dntk.top/7295.html
https://pan.quark.cn/s/109991df8940文章源自电脑天空-https://www.dntk.top/7295.html
迅雷网盘:文章源自电脑天空-https://www.dntk.top/7295.html
https://pan.xunlei.com/s/VOPkQp8aWZOLceIjxLNg4F9TA1?pwd=nhvy#文章源自电脑天空-https://www.dntk.top/7295.html
版本选择
- Paddle 引擎插件版:性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU。如果执行OCR时报错 0xc0000142、[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。
- Rapid 引擎插件版:速度稍慢,内存占用低,适合低配机器,兼容性好。