JAVA tess 识别图中文字 已训练好 识别精准
文章目录
JAVA tess 识别图中文字 已训练好 识别精准一、添加依赖二、下载更新好的中文语言包 chi_sim.traineddata,免费下载三、测试类四、结果提示:以下是本篇文章正文内容,下面案例可供参考
一、添加依赖
<dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>5.2.0</version></dependency>
二、下载更新好的中文语言包 chi_sim.traineddata,免费下载
点击进入下载 /tesseract-ocr/tessdata
三、测试类
package com.isec.platform.bi.service.bi;import net.sourceforge.tess4j.Tesseract;import net.sourceforge.tess4j.TesseractException;import java.io.File;/*** @author ChenYi* @create -01-21 13:48*/public class testOcr3 {public static void main(String[] args) throws TesseractException {//加载待读取图片File imageFile = new File("C:\\Users\\AiSK\\Desktop\\testjpg\\test1.jpg");//创建tess对象Tesseract instance = new Tesseract();//设置训练所属文件目录!!!!instance.setDatapath("D:\\chi_text\\tessdata-main");//设置训练语言instance.setLanguage("chi_sim");//执行转换String result = instance.doOCR(imageFile);System.out.println(result);}}