离线OCR识别工具 | Umi-OCR v2.1.5

软件简介

Umi-OCR是一款开源、免费且功能强大的离线文字识别工具,基于先进的离线OCR引擎开发,能够高效地将图片和文档中的文字内容提取为可编辑文本。它支持多种图片格式(如 JPEG、PNG、BMP 等)和 PDF 文档的识别,并可将识别结果导出为 TXT、MD、JSONL 等多种格式。软件内置简体中文和英文识别库,还可通过扩展包支持繁体中文、日文、韩文、俄文、德文、法文等多种语言。其界面简洁易用,即使是 OCR 初学者也能快速上手。此外,Umi-OCR 提供了丰富的高级功能,如截图识别、批量处理、忽略区域设置、二维码识别与生成等,能够满足用户在不同场景下的文字识别需求。文章源自电脑天空-https://www.dntk.top/7295.html

更新内容
  1. 新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。指定级别以上(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
  2. 新增:大部分标签页能手动切换左右/上下双栏模式。
  3. 新增:Esc键隐藏主窗口。
  4. 新增:调整二维码生成相关参数后,自动刷新二维码生成。
  5. 新增:命令行指令 --reload ,用于重新加载配置文件。
  6. 修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。
  7. 修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
  8. 修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
  9. 修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
  10. 修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
  11. 修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。
  12. 修复:Linux版本截图后,主窗口的位置与操作前不一致。
  13. 优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。
  14. Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
  15. 新增UI语言:俄语 、泰米尔语。
下载地址

夸克网盘:文章源自电脑天空-https://www.dntk.top/7295.html

https://pan.quark.cn/s/109991df8940文章源自电脑天空-https://www.dntk.top/7295.html

迅雷网盘:文章源自电脑天空-https://www.dntk.top/7295.html

https://pan.xunlei.com/s/VOPkQp8aWZOLceIjxLNg4F9TA1?pwd=nhvy#文章源自电脑天空-https://www.dntk.top/7295.html

版本选择
  1. Paddle 引擎插件版:性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU。如果执行OCR时报错 0xc0000142、[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。
  2. Rapid 引擎插件版:速度稍慢,内存占用低,适合低配机器,兼容性好。
文章源自电脑天空-https://www.dntk.top/7295.html文章源自电脑天空-https://www.dntk.top/7295.html
 
  • OCR识别
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:
确定

拖动滑块以完成验证