链接放在这里:PaddleOCR/README_ch.md at release/2.1 · PaddlePaddle/PaddleOCR · GitHub
down下来之后准备好自己的数据集
这个crop_img文件夹是通过半自动化处理后把标注的东西截取保存的文件
接下来是PPOCRLabel的打标内容:
命令行附在下面:
cd ./PPOCRLabel #将目录先切换到PPOCRLabel下
python PPOCRLabel.py --lang ch
会出现自动打标的页面
文件>打开目录>选择文件夹>左下角的自动标注
注意! 因为是半自动化标注 所以还要依次检查一边 确认后点击右下角的确认按钮
注意:如果识别或者标记不对的地方都需要自己改动
最后 点击 文件>保存标记结果>保存识别结果
接下来在你的源文件夹下可以看到生成了这些内容:
Cache.cach:保存的gt框的坐标
fileState.txt:类别标签
Label.txt:保存的gt框的坐标(一般用的都是这个)
rec_gt.txt:文本识别识别结果(对应的是文本识别)
踩坑1: 你的图片需要和这些.txt等文件是同一级目录
2.需要更改配置文件的参数configs>det>det_mv3_db.yml 文件模型
踩坑2: 如果模型地址写错 会出现找不到 .pdparams的路径,也不需要加pdparams的后缀名
这里是预训练模型
下载模型地址:
PaddleOCR/models_list.md at release/2.1 · PaddlePaddle/PaddleOCR · GitHub
踩坑3:我是下载这一个,注意是训练模型 是负责训练你的数据 不是推理模型
data_dir 需要修改成自己的
label_file_list 自己标签的位置
踩坑4: data_dir 不要写到自己的图片目录下 报错信息如下
建议调成1,因为我的电脑带不起来16,8,4线程
输入命令: python tools/train.py -c configs/det/det_mv3_db.yml
出现这种就可以了
最后训练好可以在./output/db_mv3 下面的yml中查看训练的配置文件
这里是我训练完1200个批次后 生成的文件
需要将生成的转换成为infer文件 命令如下:
python tools/export_model.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./output/db_mv3/iter
_epoch_1200 Global.save_inference_dir=./output/db_mv3_infer/
这里转换后的infer文件
换成自己的infer文件
看一下这里的检测效果
这里的识别没有写,默认的是官网 可以看到准确率很高
3.模型的识别也是一样的流程 4.总结:The ``path`` (G:/PaddleOCR-release-2.1/pretrain_models/MobileNetV3_large_x0_5_pretrained.pdparams) to loa d model not exists.‘’
出现这种错误 请看2步骤的踩坑2
后续的报错信息大家可以下面留言!误人子弟的地方希望及时指出
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)