淘小兔

tesseract-ocr是一个支持中文识别的引擎,知识兔小编为您带来了tesseract-ocr3.02版本,还附带上了简体中文的语言包,你可以用来开发识别图片中文的项目!

202202070646135943500000

tesseract-ocr介绍

知识兔

Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。 Tesseract最初由HP公司开发,后来由Google接盘。

tesseract-ocr安装步骤

知识兔

1、运行exe安装程序

202202070646146403020001

2、点击接受许可协议

202202070646167753810002

3、点击下一步

202202070646175889290003

4、选择安装目录

202202070646184420990004

5、一直点下一步,然后点安装,安装完成!

202202070646197267380005

测试tesseract-ocr识别效果

知识兔

首先,建立在桌面建立一个test文件夹,里面放一张有中文的图片tset.png

cd到这个目录,输入tesseract tset.png output_1 -l chi_sim

202202070646206353010006

运行成功,进入test文件夹查看效果

多了一个output_1.txt文件,里面有知识兔四个字,完美识别了test.png里面的文字。

202202070646212942140007

点击下载

下载仅供下载体验和测试学习,不得商用和正当使用。

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载