最近发现一个开源的OCR项目,PaddleOCR,支持通过离线部署Hub Serving服务来识别和本地程序包识别。
运行环境 :Windows 10
开发工具: Visual Studio 2022
NET版本:NET6
需要安装的程序包:PaddleOCR,版本:0.0.5 。以及PaddleOCRUtf8,版本:0.0.5
刚刚开始时候使用PaddleOCR来识别,发现英文和数字可以成功识别,准确率还很高。后面发现识别中文的时候,出现中文乱码(识别模型都是用的同一个)。后面用PaddleOCRUtf8包识别,发现可以解决中文乱码的问题,如下图:
识别图片:
识别结果:
源代码:
https://gitee.com/jucheap/demo
里面的JuCheap-Demo-OCR项目,直接运行,可以看到效果。
总结:本地包的识别,多少会有点问题,比如:【公民身份z】没有识别完整。推荐使用Hub Serving来搭建服务识别。准确率更高。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)