tesseract有没有中英文混合的语言包

tesseract有没有中英文混合的语言包,第1张

1、tesseract-ocr-setup-301-1exe 因我本地为windows系统,所以用这个 2、chi_simtraineddatagz 中文识别时需要的。 安装tesseract-ocr 自定义安装语言包 在Tesseract-OCR安装目录下找到 tessdata目录,其是用来存放语言包,可把 chi_simtrtesseract有没有中英文混合的语言包

第一步,是要下载Tesseract组件,最简单的方法就是使用VisualStudio的NUGet来下载。选择第一个组件。

第二步,下载日文语言包。

下载完成后将语言包文件解压后放到tessdata文件夹下。

到目前为止,准备工作已经就绪,可以开始编写代码。

第三步,初始化Tesseract组件,代码如下。

TesseractEngine engine = new TesseractEngine(@"tessdata文件夹路径", "jpn", EngineMode.Default))

第四步,设置OCR参数,关于各参数的解释,可以参照官网。

希望对你有帮助


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11668107.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存