栏目分类:
子分类:
返回
终身学习网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
终身学习网 > IT > 软件开发 > 后端开发 > Java

最近在做ocr文字识别,记录下安装tesseract训练工具过程

Java 更新时间:发布时间: 百科书网 趣学号
最近在做ocr文字识别,记录下安装tesseract训练工具过程

调用tesseract的API无需安装(也可以安装exe,设置环境变量),只需在vs中配置好(类似于opencv一样)

而别人或官方训练好的模型在自己的项目上效果不佳时,需要训练模型。这里记录下训练需要安装的三个工具。

  1. tesseract:有博主建议不要下载带dev,alpha,beta等,不稳定,可能是测试版本。这里大家注意下。我安装的是:tesseract-ocr-setup-4.0.0dev-20161129.exe
  2. java的JDK:需要安装java环境,我安装的是这个,jdk-8u311-windows-x64.exe。
  3. jTessBoxEditor:这个下载后不需要安装的,JDK安装没错的话可以直接启动,用这个来进行训练。

注意:安装Java JDK时,安装过程中会出现两次 安装提示 。第一次是安装 jdk ,第二次是安装 jre 。建议两个都安装在同一个java文件夹中的不同文件夹中。(不能都安装在java文件夹的根目录下,jdk和jre安装在同一文件夹会出错)(来自百度文库:https://jingyan.baidu.com/article/6dad5075d1dc40a123e36ea3.html)
并且,配置系统变量时需要配置两个:
1:新建名为:JAVA_HOME变量 ,变量值为jdk的安装目录(例如: DJavajdk1.8.0)
2:在Path输入 ;%JAVA_HOME%bin
(注意前面有;不要忘了)

转载请注明:文章转载自 www.051e.com
本文地址:http://www.051e.com/it/601684.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 ©2023-2025 051e.com

ICP备案号:京ICP备12030808号