mirror of
https://github.com/PaddlePaddle/PaddleOCR.git
synced 2025-12-27 15:08:17 +00:00
fix conflict
This commit is contained in:
commit
79a2a321ef
@ -97,7 +97,7 @@ For a new language request, please refer to [Guideline for new language_requests
|
||||
- [Benchmark](./doc/doc_en/benchmark_en.md)
|
||||
- Data Annotation and Synthesis
|
||||
- [Semi-automatic Annotation Tool: PPOCRLabel](./PPOCRLabel/README.md)
|
||||
- [Data Synthesis Tool: Style_Edit](./StyleTextRec/README.md)
|
||||
- [Data Synthesis Tool: Style-Text](./StyleText/README.md)
|
||||
- [Other Data Annotation Tools](./doc/doc_en/data_annotation_en.md)
|
||||
- [Other Data Synthesis Tools](./doc/doc_en/data_synthesis_en.md)
|
||||
- Datasets
|
||||
|
||||
@ -153,7 +153,7 @@ After adding the above synthetic data for training, the accuracy of the recognit
|
||||
### Code Structure
|
||||
|
||||
```
|
||||
style_text_rec
|
||||
StyleText
|
||||
|-- arch // Network module files.
|
||||
| |-- base_module.py
|
||||
| |-- decoder.py
|
||||
|
||||
@ -2,6 +2,7 @@
|
||||
|
||||
## Style Text
|
||||
|
||||
|
||||
### 目录
|
||||
- [一、工具简介](#工具简介)
|
||||
- [二、环境配置](#环境配置)
|
||||
@ -88,7 +89,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
||||
</div>
|
||||
|
||||
#### 批量合成
|
||||
在实际应用场景中,经常需要批量合成图片,补充到训练集中。StyleText可以使用一批风格图片和语料,批量合成数据。合成过程如下:
|
||||
在实际应用场景中,经常需要批量合成图片,补充到训练集中。Style-Text可以使用一批风格图片和语料,批量合成数据。合成过程如下:
|
||||
|
||||
1. 在`configs/dataset_config.yml`中配置目标场景风格图像和语料的路径,具体如下:
|
||||
|
||||
@ -103,7 +104,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
||||
* `language`:语料的语种;
|
||||
* `corpus_file`: 语料文件路径。
|
||||
|
||||
StyleText也提供了一批中英韩5万张通用场景数据用作文本风格图像,便于合成场景丰富的文本图像,下图给出了一些示例。
|
||||
Style-Text也提供了一批中英韩5万张通用场景数据用作文本风格图像,便于合成场景丰富的文本图像,下图给出了一些示例。
|
||||
|
||||
中英韩5万张通用场景数据: [下载地址](https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/chkoen_5w.tar)
|
||||
|
||||
@ -119,7 +120,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
||||
|
||||
<a name="应用案例"></a>
|
||||
### 四、应用案例
|
||||
下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用StyleText合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:
|
||||
下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用Style-Text合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:
|
||||
|
||||
<div align="center">
|
||||
<img src="doc/images/6.png" width="800">
|
||||
@ -135,40 +136,41 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
||||
|
||||
<a name="代码结构"></a>
|
||||
### 五、代码结构
|
||||
|
||||
```
|
||||
style_text_rec
|
||||
|-- arch
|
||||
StyleText
|
||||
|-- arch // 网络结构定义文件
|
||||
| |-- base_module.py
|
||||
| |-- decoder.py
|
||||
| |-- encoder.py
|
||||
| |-- spectral_norm.py
|
||||
| `-- style_text_rec.py
|
||||
|-- configs
|
||||
|-- configs // 配置文件
|
||||
| |-- config.yml
|
||||
| `-- dataset_config.yml
|
||||
|-- engine
|
||||
| |-- corpus_generators.py
|
||||
| |-- predictors.py
|
||||
| |-- style_samplers.py
|
||||
| |-- synthesisers.py
|
||||
| |-- text_drawers.py
|
||||
| `-- writers.py
|
||||
|-- examples
|
||||
|-- engine // 数据合成引擎
|
||||
| |-- corpus_generators.py // 从文本采样或随机生成语料
|
||||
| |-- predictors.py // 调用网络生成数据
|
||||
| |-- style_samplers.py // 采样风格图片
|
||||
| |-- synthesisers.py // 调度各个模块,合成数据
|
||||
| |-- text_drawers.py // 生成标准文字图片,用作输入
|
||||
| `-- writers.py // 将合成的图片和标签写入本地目录
|
||||
|-- examples // 示例文件
|
||||
| |-- corpus
|
||||
| | `-- example.txt
|
||||
| |-- image_list.txt
|
||||
| `-- style_images
|
||||
| |-- 1.jpg
|
||||
| `-- 2.jpg
|
||||
|-- fonts
|
||||
|-- fonts // 字体文件
|
||||
| |-- ch_standard.ttf
|
||||
| |-- en_standard.ttf
|
||||
| `-- ko_standard.ttf
|
||||
|-- tools
|
||||
|-- tools // 程序入口
|
||||
| |-- __init__.py
|
||||
| |-- synth_dataset.py
|
||||
| `-- synth_image.py
|
||||
`-- utils
|
||||
| |-- synth_dataset.py // 批量合成数据
|
||||
| `-- synth_image.py // 合成单张图片
|
||||
`-- utils // 其他基础功能模块
|
||||
|-- config.py
|
||||
|-- load_params.py
|
||||
|-- logging.py
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user