离线批量文字识别(图片转文字)软件 Umi-OCR [更新v1.2.5]
离线批量文字识别(图片转文字)软件 Umi-OCR [更新v1.2.5]
本软件用于读取剪贴板图片 / 批量导入本地图片,识别图片中的文本,输出到软件面板或本地文件。
除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能:本软件使用离线OCR模块PaddleOCR-json 图片转文字程序,使用过程中无需联网。支持更换Paddle官方模型(兼容v2和v3版本)或自己训练的模型,支持修改PaddleOCR参数。通过添加不同的语言模型,软件可识别多国语言。
简单上手
- 下载压缩包并解压全部文件即可,无需安装。
- 打开主程序,将任意 图片/文件夹 拖入窗口中的白色背景表格区域,或点击左上方的 浏览 选择图片。
- 点击右上方 开始任务 ,等待进度条走完。
- 点击 识别内容 选项卡查看输出文字,或者前往 第一张图片的目录 查看识别结果txt文件。
- 快速识别剪贴板截图
- 按 [Win+Shift+S] 截取一张系统截图,或者在网页等地方复制一张图片。
切换到 识别内容 选项卡,点击 剪贴板读取。
- 按 [Win+Shift+S] 截取一张系统截图,或者在网页等地方复制一张图片。
- 切换到 识别内容 选项卡,点击 剪贴板读取。
- 可以在 设置 选项卡中录制并启用 全局快捷键,快速唤起程序识别。若此时程序窗口处在被覆盖的后方或者被最小化,则会自动挪到最前的位置。
设置说明
- 点击 设置 选项卡,配置参数。大部分设置项修改后会自动保存。
计划任务:
- 识图任务完成后,额外执行的任务。可执行打开生成文件/目录,自动关机/待机等。
- 即使识图任务正在进行中,也可以随意修改这些选项。
- 可创建自己的计划任务(cmd命令)。
- 忽略图片中某些区域内的文字:
- 点击 添加区域 展开配置忽略区的新窗口。
- 点击 清空区域 清空已配置的所有忽略区域参数。
- 已添加区域后,上方标题文字提示当前忽略区域的 生效分辨率 。
从剪贴板读取图片:
点击 录制按键 后按下想要的快捷键,如 ctrl+shift+s 。然后勾选 启用全局快捷键 。
按下快捷键后,程序检查当前剪贴板的第一位是否为图片,是则程序跳到顶层并展示识别文字。
请检查并避免全局快捷键与其它程序冲突。
可设置识图后 自动复制识别内容(不含任务时间等信息的纯内容文本)。此设置只对剪贴板识图生效,批量任务时无效。
输入设置:
- 递归读取子文件夹中所有图片 若勾选,拖入文件夹到处理列表时,会导入所有子文件夹中的图片。否则只会导入一层文件夹下的图片。
输出设置:
- 将 识别内容写入本地文件 取消勾选后,不会再生成本地文件,只能在 识别内容 选项卡中查看输出信息。若设置了本次任务完成后自动关机,请务必勾选此项,以免至今为止的努力全部木大。
忽略区域功能
- 忽略区域是本软件特色功能,可用于排除图片中水印的干扰,让识别结果只留下所需的文本。
“忽略区域”是指图片上指定位置与大小的矩形区域,完全处于这些区域内的文字块,将被排除。 - 点击 设置 选项卡中的 添加忽略区域 ,进入忽略区域选择窗口。
- 将任意图片 拖入 该窗口,可预览该图片。将新图片拖入窗口可切换预览,但已绘制的忽略区域不会消失;可切换不同图片来仔细调整忽略区域。
- 绘制 忽略区域 :拖入图片后,点击选中左起第一按钮 +忽略区域 1 ,然后在图片上按住左键拖拽,绘制矩形区域。可 撤销 步骤。
- 绘制完后,点击 完成 返回软件主窗口。若不想应用此次绘制,则右上角X,取消。
- 更多详细功能说明,详见Github项目主页。
下载地址:
https://github.com/hiroi-sora/Umi-OCR
阅读剩余
著作权归作者所有。商业转载请联系作者进行授权,非商业转载请注明出处。
THE END