mirror of
https://github.com/PaddlePaddle/PaddleOCR.git
synced 2025-12-27 23:18:23 +00:00
1.增加gen_ocr_train_val.py使用说明文档和文档中用到的图片
2.增加windows环境下可以直接执行gen_ocr_train_val.py的bat文件gen_ocr_train_val.bat 3.执行gen_ocr_train_val.py脚本时,如果没有划分好的train.txt和val.txt标注文件,会报没有这些文件的错误
This commit is contained in:
parent
c65b5ce64e
commit
02bd0f0ddb
BIN
20211008154929.png
Normal file
BIN
20211008154929.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 19 KiB |
BIN
20211008155029.png
Normal file
BIN
20211008155029.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 25 KiB |
@ -91,12 +91,12 @@ if __name__ == "__main__":
|
||||
parser.add_argument(
|
||||
"--detRootPath",
|
||||
type=str,
|
||||
default="./train_data/det/demPanel",
|
||||
default="./train_data/det",
|
||||
help="the path where the divided detection dataset is placed")
|
||||
parser.add_argument(
|
||||
"--recRootPath",
|
||||
type=str,
|
||||
default="./train_data/rec/demPanel",
|
||||
default="./train_data/rec",
|
||||
help="the path where the divided recognition dataset is placed"
|
||||
)
|
||||
parser.add_argument(
|
||||
|
||||
@ -4,11 +4,10 @@
|
||||
|
||||
3、使用方法:
|
||||
|
||||
3.1 首先使用PPOCRLabel标注好图像,一般是分批次标注,多个标注好的图像文件夹存放目录结构如下,把自己的数据集放在train_data目录下的label文件夹里,文件夹没有自己创建,label同级路径下创建det文件夹存放划分好的文本检测数据集,label同级路径下创建rec文件夹存放划分好的字符识别数据集,目录结构如下图所示:
|
||||
3.1 首先使用PPOCRLabel标注好图像,一般是分批次标注,多个标注好的图像文件夹存放在train_data目录下的label文件夹里,文件夹没有自己创建,label同级路径下创建det文件夹存放划分好的文本检测数据集,label同级路径下创建rec文件夹存放划分好的字符识别数据集,目录结构如下图所示:
|
||||
|
||||

|
||||
|
||||

|
||||

|
||||

|
||||
|
||||
3.2 gen_ocr_train_val.py参数说明
|
||||
|
||||
@ -27,5 +26,7 @@ recLabelFileName 使用PPOCRLabel标注图像时,点击导出识别结果后
|
||||
recImageDirName 使用PPOCRLabel标注图像时,点击导出识别结果后,会把裁剪后的字符图像保存到crop_img文件夹内
|
||||
|
||||
3.3 执行gen_ocr_train_val.py方法
|
||||
|
||||
python gen_ocr_train_val.py --trainValRatio 0.8 --labelRootPath ./train_data/label --detRootPath ./train_data/det --recRootPath ./train_data/rec
|
||||
如果目录结构和文件夹名称是严格按照以上说明创建的,可以直接在windows环境下执行gen_ocr_train_val.bat,在linux环境下需要执行gen_ocr_train_val.sh,默认划分比例是0.8
|
||||
也可以在终端中输入以下命令执行:
|
||||
python gen_ocr_train_val.py --trainValRatio 0.8 --labelRootPath ./train_data/label --detRootPath ./train_data/det --recRootPath ./train_data/rec
|
||||
如果想创建自己的目录结构和文件夹名称,需要手动修改命令里的路径
|
||||
|
||||
2
gen_ocr_train_val.sh
Normal file
2
gen_ocr_train_val.sh
Normal file
@ -0,0 +1,2 @@
|
||||
#!/bin/bash
|
||||
python gen_ocr_train_val.py --trainValRatio 0.8 --labelRootPath ./train_data/label --detRootPath ./train_data/det --recRootPath ./train_data/rec
|
||||
Loading…
x
Reference in New Issue
Block a user