1.增加gen_ocr_train_val.py使用说明文档和文档中用到的图片

2.增加windows环境下可以直接执行gen_ocr_train_val.py的bat文件gen_ocr_train_val.bat
3.执行gen_ocr_train_val.py脚本时,如果没有划分好的train.txt和val.txt标注文件,会报没有这些文件的错误
This commit is contained in:
–MrCuiHao 2021-10-08 16:17:18 +08:00
parent c65b5ce64e
commit 02bd0f0ddb
5 changed files with 11 additions and 8 deletions

BIN
20211008154929.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 19 KiB

BIN
20211008155029.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 25 KiB

View File

@ -91,12 +91,12 @@ if __name__ == "__main__":
parser.add_argument(
"--detRootPath",
type=str,
default="./train_data/det/demPanel",
default="./train_data/det",
help="the path where the divided detection dataset is placed")
parser.add_argument(
"--recRootPath",
type=str,
default="./train_data/rec/demPanel",
default="./train_data/rec",
help="the path where the divided recognition dataset is placed"
)
parser.add_argument(

View File

@ -4,11 +4,10 @@
3、使用方法
3.1 首先使用PPOCRLabel标注好图像一般是分批次标注多个标注好的图像文件夹存放目录结构如下,把自己的数据集放在train_data目录下的label文件夹里文件夹没有自己创建label同级路径下创建det文件夹存放划分好的文本检测数据集label同级路径下创建rec文件夹存放划分好的字符识别数据集目录结构如下图所示
3.1 首先使用PPOCRLabel标注好图像一般是分批次标注多个标注好的图像文件夹存放在train_data目录下的label文件夹里文件夹没有自己创建label同级路径下创建det文件夹存放划分好的文本检测数据集label同级路径下创建rec文件夹存放划分好的字符识别数据集目录结构如下图所示
![image-20211008140656452](image-20211008140656452.png)
![image-20211008140833352](image-20211008140833352.png)
![20211008154929](20211008154929.png)
![20211008155029](20211008155029.png)
3.2 gen_ocr_train_val.py参数说明
@ -27,5 +26,7 @@ recLabelFileName 使用PPOCRLabel标注图像时点击导出识别结果后
recImageDirName 使用PPOCRLabel标注图像时点击导出识别结果后会把裁剪后的字符图像保存到crop_img文件夹内
3.3 执行gen_ocr_train_val.py方法
python gen_ocr_train_val.py --trainValRatio 0.8 --labelRootPath ./train_data/label --detRootPath ./train_data/det --recRootPath ./train_data/rec
如果目录结构和文件夹名称是严格按照以上说明创建的可以直接在windows环境下执行gen_ocr_train_val.bat在linux环境下需要执行gen_ocr_train_val.sh默认划分比例是0.8
也可以在终端中输入以下命令执行:
python gen_ocr_train_val.py --trainValRatio 0.8 --labelRootPath ./train_data/label --detRootPath ./train_data/det --recRootPath ./train_data/rec
如果想创建自己的目录结构和文件夹名称,需要手动修改命令里的路径

2
gen_ocr_train_val.sh Normal file
View File

@ -0,0 +1,2 @@
#!/bin/bash
python gen_ocr_train_val.py --trainValRatio 0.8 --labelRootPath ./train_data/label --detRootPath ./train_data/det --recRootPath ./train_data/rec