Teststand不识别中文_IT百科

使用tesseract进行文字识别可以分为cmd和python调用两个方法，前者是在cmd上直接运行tesseract ocr（这个软件需要单独下载和安装，百度可以得到很多），后者是通过python中tesseract模块来调用tesseract ocr。

注意：（1）安装过程可以直接勾选中文简体甚至所有的语言包（也可以单独下载语言包添加到OCR安装目录中的tessdata文件夹下）；

（2）环境变量中需要设置两个变量，一是用户变量中新建TESSDATA_PREFIX变量，然后系统变量path中添加OCR路径。

你想了解怎么利用程序自动识别网站验证码吗？识别提取图像文字（中文英文都可以）

分享一点简单有用的小项目：python

源码分享如下：

看视频教程链接：（点击识别图像文字视频教程链接）

一、首先需要安装 Tesseract模块及 语言包

Tesseract OCR光学字符识别

Windows系统：

安装网站（放在不需要权限的纯英文路径下）：

： https://digi.bib.uni-mannheim.de/tesseract/

可以下载一些语言包：

https://github.com/tesseract-ocr/

安装完成后，如果想要在命令行中使用Tesseract，那么应该设置环境变量。

还有一个环境变量需要设置的是，要把训练的数据文件路径也放到环境变量中。

在环境变量中，添加一个TESSDATA_PREFIX=C:path_to_tesseractdata eseractdata。

在Python代码中 *** 作tesseract。需要安装一个库，叫做pytesseract。通过pip的方式即可安装：

pip install pytesseract

并且，需要读取图片，需要借助一个第三方库叫做PIL。通过pip list看下是否安装。如果没有安装，通过pip的方式安装：

pip install PIL

使用pytesseract将图片上的文字转换为文本文字的示例代码如下：

欢迎分享，转载请注明来源：内存溢出

Teststand不识别中文