软件介绍

      jTessBoxEditor最新版可以对识别的准确做到很详细的操作。jTessBoxEditor最新版还能够持续的训练,做到更好的提高。

软件特色

      能够提高Tesseract-OCR文字识别准确率

      通过jTessBoxEditor的不断训练使得Tesseract-OCR文字识别准确率得到极大的提高

使用方法

      jTessBoxEditor的运行环境为JAVA虚拟机,teesseract智能图片识别软件的训练框架,不需要安装直接解压即可,不过要事先安装一个jar包jdk-8u101-windows-x64虚拟机。

      用jTessBoxEditor自动训练3500常用汉字

      打开jTessBoxEditor图形化界面

      (1)点击TIFF/BoxGenerator按钮

      (2)将3500汉字copy到空白区域

      (3)选择文件夹:(自己创建文件夹名字随意,我的是在F盘创建的)

jTessBoxEditor

      (4)命名(自己随意命名,比如我的是haha)

jTessBoxEditor(配套训练工具)

      (5) 选择自己药训练的字体(比如我的是宋体9pt)

jTessBoxEditor

      (6)然后点击Generate按钮生成tif和box文件

jTessBoxEditor(配套训练工具)

      (7)点击Trainer按钮

jTessBoxEditor

      (8)打开之前创建的文件夹

      (9)Language那里需要改名字(改成与第四步一样的名字,我的是haha)

      (10)选择Train with Existing Box

      (11)然后点击run

      (12)成功后:


相关软件推荐