UMIOCR识别工具是一个和天若OCR类似的文字识别软件,能够通过设置快捷键的功能来识别电脑上面的截图以及网页文字等等,完美解决页面无法复制,英文输入困难等问题。
Umi-OCR,免费可离线使用的OCR识别软件,适用于 Win10 x64 平台的离线OCR软件。批量导入本地图片 / 读取剪贴板,识别图片中的文本,输出到软件面板或本地 .txt / .md 文件。
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
高效:自带高效率的离线OCR引擎,内置多种语言识别库。
灵活:支持命令行、HTTP接口等外部调用方式。
功能:截图OCR/批量OCR/PDF识别/二维码/公式识别
首先说说兼容性,Win7不建议使用Umi-OCR,大概率是无法使用,推荐 Win10 以上系统。
兼容性
软件不大,解压之后,运行主程序,界面也比较简单,只有简单的几个按钮。
主界面
点击「浏览」按钮导入或者直接拖入需要识别的图片,图片格式支持 jpg、png、bmp 等常见格式,图片支持批量导入。
OCR识别图片
然后点击「开始任务」,软件将会识别所有已导入图片的文字信息,等待进度条走完,识别结果会显示在「识别内容」选项卡中。
与此同时,Umi-OCR 还会自动在桌面上生成一份带有识别结果的 txt 文本文档。
点击「复制文字」按钮可以全部复制下识别到的内容,如果只需要复制部分文字,可以用鼠标选择之后通过快捷键「CTRL+C」进行复制。
其实,许多时候,我们通过 OCR 识别图片上的文字,往往并不需要全部识别所有区域,比如某个截图上的水印文字就会很大程度上干扰识别结果。
Umi-OCR 支持自定义设置忽略图片中的某处区域,以便实现更精准的识别。
操作方式是先进入设置,然后「添加区域」,将需要忽略或者识别的区域进行重点框选,点击「完成」之后,设置就会生效。
设置一次,对所有图片全部起作用,如果不再需要先前设置的忽略区域,直接清空即可!
除了识别图片文件,对于已经复制到剪贴板的图片,Umi-OCR 也能识别。
「识别内容」选项卡下的「剪贴板读取」也即是对应的剪贴板识别功能。
软件默认仅支持识别简体中文和英文项目,如果需要识别其它语言,还需要单独导入多国语言识别扩展包才能使用。
多国语言识别扩展包包括的语言有繁体中文、日文、韩文、法文和德文,导入方式是将扩展包文件拷贝到软件目录。
Umi-OCR 是一款适用于Win10/11 x64 平台的免费、离线 OCR 文字识别工具,基于 PaddleOCR,支持批量导入、读取剪贴板,可排除图片中水印区域,提取干净的文本。
当然Ocr工具也很多,Umi-OCR 这个软件可以离线识别,所以永远不怕和谐。
Umi-OCR 全新 V2 版本更加不错了,完全免费,开源,可批量的离线 OCR 软件,非常推荐使用。
修复:引擎原始输出项的"text"为空时,导致文本分析越界的错误。(#625)
新增UI语言:葡萄牙语Português。译者:[color=var(--fgColor-accent,var(--color-accent-fg))]@杨鹏
PaddleOCR插件相关:
修复:布尔类型选项不生效的问题。
修复:繁体中文配置文件错误的问题。
优化:调整默认线程/内存限制,默认内存占用不超过系统总内存的一半。
优化:调整识别语言库结构,精简不必要的文件。