mirror of
https://github.com/PaddlePaddle/PaddleOCR.git
synced 2025-12-28 07:28:55 +00:00
docs: update docs (#15654)
* update PP-StructureV3 doc * update text det model doc for max_side_limit * update docs
This commit is contained in:
parent
803638d173
commit
20afe10af6
@ -303,209 +303,625 @@ The above data is from:
|
||||
* <a href="https://arxiv.org/abs/2412.07626">OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations</a>
|
||||
|
||||
# End to End Benchmark
|
||||
## Requirements
|
||||
|
||||
The performance of PP-StructureV3 and MinerU with different configurations under different GPU environments are as follows.
|
||||
|
||||
Requirements:
|
||||
* Paddle 3.0
|
||||
* PaddleOCR 3.0.0
|
||||
* MinerU 1.3.10
|
||||
* CUDA 11.8
|
||||
* cuDNN 8.9
|
||||
|
||||
## Data
|
||||
1. Local inference
|
||||
## Local inference
|
||||
|
||||
Data: 15 PDF files, totaling 925 pages, containing elements such as tables, formulas, seals, charts, etc.
|
||||
Local inference was tested with both V100 and A100 GPU, evaluating the performance of PP-StructureV3 under 6 different configurations. The test data consists of 15 PDF files, totaling 925 pages, including elements such as tables, formulas, seals, and charts.
|
||||
|
||||
Env: NVIDIA Tesla V100 + Intel Xeon Gold 6271C
|
||||
In the following PP-StructureV3 configuration, please refer to [PP-OCRv5](../PP-OCRv5/PP-OCRv5.en.md) for OCR model details, see [Formula Recognition](../../module_usage/formula_recognition.en.md) for formula recognition model details, and refer to [Text Detection](../../module_usage/text_detection.en.md) for the max_side_limit setting of the text detection module.
|
||||
|
||||
<table>
|
||||
<colgroup>
|
||||
<col>
|
||||
</colgroup>
|
||||
<tbody>
|
||||
<tr>
|
||||
<td></td>
|
||||
<td>Pipeline Configurations</td>
|
||||
<td>Average time per page (s)</td>
|
||||
<td>Average CPU (%)</td>
|
||||
<td>Peak RAM Usage (MB)</td>
|
||||
<td>Average RAM Usage (MB)</td>
|
||||
<td>Average GPU (%)</td>
|
||||
<td>Peak VRAM Usage (MB)</td>
|
||||
<td>Average VRAM Usage (MB)</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td rowspan="6">PP-StructureV3</td>
|
||||
<td>Basic</td>
|
||||
<td>1.77</td>
|
||||
<td>111.4</td>
|
||||
<td>6822.4</td>
|
||||
<td>5278.2</td>
|
||||
<td>38.9</td>
|
||||
<td>17403</td>
|
||||
<td>16909.3</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use chart recognition pipeline</td>
|
||||
<td>4.09</td>
|
||||
<td>105.3</td>
|
||||
<td>5628</td>
|
||||
<td>4085.1</td>
|
||||
<td>24.7</td>
|
||||
<td>17403</td>
|
||||
<td>17030.9</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec</td>
|
||||
<td>1.56</td>
|
||||
<td>113.7</td>
|
||||
<td>6712.9</td>
|
||||
<td>5052</td>
|
||||
<td>29.1</td>
|
||||
<td>10929</td>
|
||||
<td>10840.7</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-FormulaNet_plus-M</td>
|
||||
<td>1.42</td>
|
||||
<td>112.9</td>
|
||||
<td>6944.1</td>
|
||||
<td>5193.6</td>
|
||||
<td>38</td>
|
||||
<td>16390</td>
|
||||
<td>15840</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec + PP-FormulaNet_plus-M</td>
|
||||
<td>1.15</td>
|
||||
<td>114.8</td>
|
||||
<td>6666.5</td>
|
||||
<td>5105.4</td>
|
||||
<td>26.1</td>
|
||||
<td>8606</td>
|
||||
<td>8517.2</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec + PP-FormulaNet_plus-M, and max input length of text detection set to 1200</td>
|
||||
<td>0.99</td>
|
||||
<td>113</td>
|
||||
<td>7172.9</td>
|
||||
<td>5686.4</td>
|
||||
<td>29.2</td>
|
||||
<td>8776</td>
|
||||
<td>8680.8</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>MinerU</td>
|
||||
<td>-</td>
|
||||
<td>1.57</td>
|
||||
<td>142.9</td>
|
||||
<td>13655.8</td>
|
||||
<td>12083</td>
|
||||
<td>43.3</td>
|
||||
<td>32406</td>
|
||||
<td>9915.4</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
### Env: NVIDIA Tesla V100 + Intel Xeon Gold 6271C
|
||||
|
||||
<table border="1">
|
||||
<tr>
|
||||
<td>
|
||||
Methods
|
||||
</td>
|
||||
<td colspan="4">
|
||||
Configurations
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average time per
|
||||
page
|
||||
(s)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average CPU
|
||||
(%)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Peak RAM Usage
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average RAM
|
||||
Usage
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average GPU
|
||||
(%)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Peak VRAM Usage
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average VRAM
|
||||
Usage
|
||||
(MB)
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td rowspan="7">
|
||||
PP-StructureV3
|
||||
</td>
|
||||
<td>
|
||||
OCR Models
|
||||
</td>
|
||||
<td>
|
||||
Formula Recognition Model
|
||||
</td>
|
||||
<td>
|
||||
Chart Recognition Model
|
||||
</td>
|
||||
<td>
|
||||
text detection module max_side_limit
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.77
|
||||
</td>
|
||||
<td>
|
||||
111.4
|
||||
</td>
|
||||
<td>
|
||||
6.7
|
||||
</td>
|
||||
<td>
|
||||
5.2
|
||||
</td>
|
||||
<td>
|
||||
38.9
|
||||
</td>
|
||||
<td>
|
||||
17.0
|
||||
</td>
|
||||
<td>
|
||||
16.5
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✔
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
4.09
|
||||
</td>
|
||||
<td>
|
||||
105.3
|
||||
</td>
|
||||
<td>
|
||||
5.5
|
||||
</td>
|
||||
<td>
|
||||
4.0
|
||||
</td>
|
||||
<td>
|
||||
24.7
|
||||
</td>
|
||||
<td>
|
||||
17.0
|
||||
</td>
|
||||
<td>
|
||||
16.6
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.56
|
||||
</td>
|
||||
<td>
|
||||
113.7
|
||||
</td>
|
||||
<td>
|
||||
6.6
|
||||
</td>
|
||||
<td>
|
||||
4.9
|
||||
</td>
|
||||
<td>
|
||||
29.1
|
||||
</td>
|
||||
<td>
|
||||
10.7
|
||||
</td>
|
||||
<td>
|
||||
10.6
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.42
|
||||
</td>
|
||||
<td>
|
||||
112.9
|
||||
</td>
|
||||
<td>
|
||||
6.8
|
||||
</td>
|
||||
<td>
|
||||
5.1
|
||||
</td>
|
||||
<td>
|
||||
38
|
||||
</td>
|
||||
<td>
|
||||
16.0
|
||||
</td>
|
||||
<td>
|
||||
15.5
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.15
|
||||
</td>
|
||||
<td>
|
||||
114.8
|
||||
</td>
|
||||
<td>
|
||||
6.5
|
||||
</td>
|
||||
<td>
|
||||
5.0
|
||||
</td>
|
||||
<td>
|
||||
26.1
|
||||
</td>
|
||||
<td>
|
||||
8.4
|
||||
</td>
|
||||
<td>
|
||||
8.3
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
1200
|
||||
</td>
|
||||
<td>
|
||||
0.99
|
||||
</td>
|
||||
<td>
|
||||
113
|
||||
</td>
|
||||
<td>
|
||||
7.0
|
||||
</td>
|
||||
<td>
|
||||
5.6
|
||||
</td>
|
||||
<td>
|
||||
29.2
|
||||
</td>
|
||||
<td>
|
||||
8.6
|
||||
</td>
|
||||
<td>
|
||||
8.5
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
MinerU
|
||||
</td>
|
||||
<td colspan="4">
|
||||
-
|
||||
</td>
|
||||
<td>
|
||||
1.57
|
||||
</td>
|
||||
<td>
|
||||
142.9
|
||||
</td>
|
||||
<td>
|
||||
13.3
|
||||
</td>
|
||||
<td>
|
||||
11.8
|
||||
</td>
|
||||
<td>
|
||||
43.3
|
||||
</td>
|
||||
<td>
|
||||
31.6
|
||||
</td>
|
||||
<td>
|
||||
9.7
|
||||
</td>
|
||||
</tr>
|
||||
</table>
|
||||
|
||||
Env:NVIDIA A100 + Intel Xeon Platinum 8350C
|
||||
### NVIDIA A100 + Intel Xeon Platinum 8350C
|
||||
|
||||
<table>
|
||||
<colgroup>
|
||||
<col>
|
||||
</colgroup>
|
||||
<tbody>
|
||||
<tr>
|
||||
<td></td>
|
||||
<td>Pipeline Configurations</td>
|
||||
<td>Average time per page (s)</td>
|
||||
<td>Average CPU (%)</td>
|
||||
<td>Peak RAM Usage (MB)</td>
|
||||
<td>Average RAM Usage (MB)</td>
|
||||
<td>Average GPU (%)</td>
|
||||
<td>Peak VRAM Usage (MB)</td>
|
||||
<td>Average VRAM Usage (MB)</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td rowspan="6">PP-StructureV3</td>
|
||||
<td>Basic</td>
|
||||
<td>1.12</td>
|
||||
<td>109.8</td>
|
||||
<td>9418.3</td>
|
||||
<td>7977.9</td>
|
||||
<td>29.8</td>
|
||||
<td>22294</td>
|
||||
<td>21638.4</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use chart recognition pipeline</td>
|
||||
<td>2.76</td>
|
||||
<td>103.7</td>
|
||||
<td>9253.6</td>
|
||||
<td>7840.6</td>
|
||||
<td>24</td>
|
||||
<td>22298</td>
|
||||
<td>21555.3</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec</td>
|
||||
<td>1.04</td>
|
||||
<td>110.7</td>
|
||||
<td>9520.8</td>
|
||||
<td>8034.3</td>
|
||||
<td>22</td>
|
||||
<td>12490</td>
|
||||
<td>12383.1</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-FormulaNet_plus-M</td>
|
||||
<td>0.95</td>
|
||||
<td>111.4</td>
|
||||
<td>9272.9</td>
|
||||
<td>7939.9</td>
|
||||
<td>28.1</td>
|
||||
<td>22350</td>
|
||||
<td>21498.4</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec + PP-FormulaNet_plus-M</td>
|
||||
<td>0.89</td>
|
||||
<td>112.1</td>
|
||||
<td>9457.2</td>
|
||||
<td>8031.5</td>
|
||||
<td>18.5</td>
|
||||
<td>11642</td>
|
||||
<td>11433.6</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec + PP-FormulaNet_plus-M, and max length of text detection set to 1200</td>
|
||||
<td>0.64</td>
|
||||
<td>113.5</td>
|
||||
<td>10401.1</td>
|
||||
<td>8688.8</td>
|
||||
<td>23.7</td>
|
||||
<td>11716</td>
|
||||
<td>11453.9</td>
|
||||
</tr>
|
||||
<tr">
|
||||
<td>MinerU</td>
|
||||
<td>-</td>
|
||||
<td>1.06</td>
|
||||
<td>168.3</td>
|
||||
<td>18690.4</td>
|
||||
<td>17213.8</td>
|
||||
<td>27.5</td>
|
||||
<td>78760</td>
|
||||
<td>15119</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
<table border="1">
|
||||
<tr>
|
||||
<td>
|
||||
Methods
|
||||
</td>
|
||||
<td colspan="4">
|
||||
Configurations
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average time per
|
||||
page
|
||||
(s)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average CPU
|
||||
(%)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Peak RAM Usage
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average RAM
|
||||
Usage
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average GPU
|
||||
(%)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Peak VRAM Usage
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
Average VRAM
|
||||
Usage
|
||||
(MB)
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td rowspan="7">
|
||||
PP-StructureV3
|
||||
</td>
|
||||
<td>
|
||||
OCR Models
|
||||
</td>
|
||||
<td>
|
||||
Formula Recognition Model
|
||||
</td>
|
||||
<td>
|
||||
Chart Recognition Model
|
||||
</td>
|
||||
<td>
|
||||
text detection module max_side_limit
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.12
|
||||
</td>
|
||||
<td>
|
||||
109.8
|
||||
</td>
|
||||
<td>
|
||||
9.2
|
||||
</td>
|
||||
<td>
|
||||
7.8
|
||||
</td>
|
||||
<td>
|
||||
29.8
|
||||
</td>
|
||||
<td>
|
||||
21.8
|
||||
</td>
|
||||
<td>
|
||||
21.1
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✔
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
2.76
|
||||
</td>
|
||||
<td>
|
||||
103.7
|
||||
</td>
|
||||
<td>
|
||||
9.0
|
||||
</td>
|
||||
<td>
|
||||
7.7
|
||||
</td>
|
||||
<td>
|
||||
24
|
||||
</td>
|
||||
<td>
|
||||
21.8
|
||||
</td>
|
||||
<td>
|
||||
21.1
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.04
|
||||
</td>
|
||||
<td>
|
||||
110.7
|
||||
</td>
|
||||
<td>
|
||||
9.3
|
||||
</td>
|
||||
<td>
|
||||
7.8
|
||||
</td>
|
||||
<td>
|
||||
22
|
||||
</td>
|
||||
<td>
|
||||
12.2
|
||||
</td>
|
||||
<td>
|
||||
12.1
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
0.95
|
||||
</td>
|
||||
<td>
|
||||
111.4
|
||||
</td>
|
||||
<td>
|
||||
9.1
|
||||
</td>
|
||||
<td>
|
||||
7.8
|
||||
</td>
|
||||
<td>
|
||||
28.1
|
||||
</td>
|
||||
<td>
|
||||
21.8
|
||||
</td>
|
||||
<td>
|
||||
21.0
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
0.89
|
||||
</td>
|
||||
<td>
|
||||
112.1
|
||||
</td>
|
||||
<td>
|
||||
9.2
|
||||
</td>
|
||||
<td>
|
||||
7.8
|
||||
</td>
|
||||
<td>
|
||||
18.5
|
||||
</td>
|
||||
<td>
|
||||
11.4
|
||||
</td>
|
||||
<td>
|
||||
11.2
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
1200
|
||||
</td>
|
||||
<td>
|
||||
0.64
|
||||
</td>
|
||||
<td>
|
||||
113.5
|
||||
</td>
|
||||
<td>
|
||||
10.2
|
||||
</td>
|
||||
<td>
|
||||
8.5
|
||||
</td>
|
||||
<td>
|
||||
23.7
|
||||
</td>
|
||||
<td>
|
||||
11.4
|
||||
</td>
|
||||
<td>
|
||||
11.2
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
MinerU
|
||||
</td>
|
||||
<td colspan="4">
|
||||
-
|
||||
</td>
|
||||
<td>
|
||||
1.06
|
||||
</td>
|
||||
<td>
|
||||
168.3
|
||||
</td>
|
||||
<td>
|
||||
18.3
|
||||
</td>
|
||||
<td>
|
||||
16.8
|
||||
</td>
|
||||
<td>
|
||||
27.5
|
||||
</td>
|
||||
<td>
|
||||
76.9
|
||||
</td>
|
||||
<td>
|
||||
14.8
|
||||
</td>
|
||||
</tr>
|
||||
</table>
|
||||
|
||||
2. Serving
|
||||
## Serving Inference
|
||||
|
||||
Data: 1500 images, including tables, formulas, seals, charts, and other elements.
|
||||
Use default configuration.
|
||||
The serving inference test is based on the NVIDIA A100 + Intel Xeon Platinum 8350C environment, with test data consisting of 1500 images, including tables, formulas, seals, charts, and other elements.
|
||||
|
||||
<table>
|
||||
<tbody>
|
||||
@ -517,18 +933,18 @@ Use default configuration.
|
||||
<td>Success Number/Total Number</td>
|
||||
</tr>
|
||||
<tr">
|
||||
<td>4 GPUs * 1</td>
|
||||
<td>4 GPUs ✖️ 1实例/卡</td>
|
||||
<td>4</td>
|
||||
<td>1.69</td>
|
||||
<td>2.36</td>
|
||||
<td>1</td>
|
||||
<td>100%</td>
|
||||
</tr>
|
||||
<tr">
|
||||
<td>4 GPUs * 4</td>
|
||||
<td>4 GPUs ✖️ 4实例/卡</td>
|
||||
<td>16</td>
|
||||
<td>4.05</td>
|
||||
<td>3.87</td>
|
||||
<td>1</td>
|
||||
<td>100%</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
</table>
|
||||
|
||||
@ -302,208 +302,618 @@
|
||||
* <a href="https://arxiv.org/abs/2412.07626">OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations</a>
|
||||
|
||||
|
||||
# 三、端到端推理benchmark
|
||||
## 3.1 测试条件
|
||||
# 三、推理 Benchmark
|
||||
|
||||
在不同GPU环境下,不同配置的 PP-StructureV3 和 MinerU 对比的性能指标如下。
|
||||
|
||||
基本测试环境:
|
||||
* Paddle 3.0正式版
|
||||
* PaddleOCR 3.0.0正式版
|
||||
* MinerU 1.3.10
|
||||
* CUDA 11.8
|
||||
* cuDNN 8.9
|
||||
|
||||
## 3.2 测试数据
|
||||
1. 本地推理
|
||||
## 3.1 本地推理
|
||||
|
||||
测试硬件:NVIDIA Tesla V100 + Intel Xeon Gold 6271C
|
||||
本地推理分别在 V100 和 A100 两种 GPU机器上,测试了 6 种不同配置下 PP-StructureV3 的性能,测试数据为15个PDF文件,共925页,包含表格、公式、印章、图表等元素。
|
||||
|
||||
<table style="width:585pt">
|
||||
<colgroup>
|
||||
<col width="87" span="9" style="width:65pt">
|
||||
</colgroup>
|
||||
<tbody>
|
||||
<tr>
|
||||
<td></td>
|
||||
<td>产线配置</td>
|
||||
<td>平均每页耗时(s)</td>
|
||||
<td>平均CPU利用率(%)</td>
|
||||
<td>峰值RAM用量(MB)</td>
|
||||
<td>平均RAM用量(MB)</td>
|
||||
<td>平均GPU利用率(%)</td>
|
||||
<td>峰值VRAM用量(MB)</td>
|
||||
<td>平均VRAM用量(MB)</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td rowspan="6">PP-StructureV3</td>
|
||||
<td>基础配置</td>
|
||||
<td>1.77</td>
|
||||
<td>111.4</td>
|
||||
<td>6822.4</td>
|
||||
<td>5278.2</td>
|
||||
<td>38.9</td>
|
||||
<td>17403</td>
|
||||
<td>16909.3</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>使用图表识别</td>
|
||||
<td>4.09</td>
|
||||
<td>105.3</td>
|
||||
<td>5628</td>
|
||||
<td>4085.1</td>
|
||||
<td>24.7</td>
|
||||
<td>17403</td>
|
||||
<td>17030.9</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>使用 PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec 轻量模型</td>
|
||||
<td>1.56</td>
|
||||
<td>113.7</td>
|
||||
<td>6712.9</td>
|
||||
<td>5052</td>
|
||||
<td>29.1</td>
|
||||
<td>10929</td>
|
||||
<td>10840.7</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>使用 PP-FormulaNet-M 轻量公式识别模型</td>
|
||||
<td>1.42</td>
|
||||
<td>112.9</td>
|
||||
<td>6944.1</td>
|
||||
<td>5193.6</td>
|
||||
<td>38</td>
|
||||
<td>16390</td>
|
||||
<td>15840</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>使用 PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec + PP-FormulaNet-M</td>
|
||||
<td>1.15</td>
|
||||
<td>114.8</td>
|
||||
<td>6666.5</td>
|
||||
<td>5105.4</td>
|
||||
<td>26.1</td>
|
||||
<td>8606</td>
|
||||
<td>8517.2</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>使用 PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec + PP-FormulaNet-M,文本检测模型输入最大尺寸设置为 1200</td>
|
||||
<td>0.99</td>
|
||||
<td>113</td>
|
||||
<td>7172.9</td>
|
||||
<td>5686.4</td>
|
||||
<td>29.2</td>
|
||||
<td>8776</td>
|
||||
<td>8680.8</td>
|
||||
</tr>
|
||||
<tr data-slate-node="element">
|
||||
<td data-gramm="false" data-slate-node="element" data-slate-type="table-cell" data-slate-render-key="PpiUjdl1" cellindex="0">MinerU</td>
|
||||
<td>-</td>
|
||||
<td>1.57</td>
|
||||
<td>142.9</td>
|
||||
<td>13655.8</td>
|
||||
<td>12083</td>
|
||||
<td>43.3</td>
|
||||
<td>32406</td>
|
||||
<td>9915.4</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
下述 PP-StructureV3 配置中,OCR 模型详情请见[PP-OCRv5](../PP-OCRv5/PP-OCRv5.md),公式识别模型详情请见[公式识别](../../module_usage/formula_recognition.md),文本检测模块 max_side_limit 设置请见[文本检测](../../module_usage/text_detection.md)。
|
||||
|
||||
### NVIDIA Tesla V100 + Intel Xeon Gold 6271C
|
||||
<table border="1">
|
||||
<tr>
|
||||
<td>
|
||||
方案
|
||||
</td>
|
||||
<td colspan="4">
|
||||
配置
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均每页耗时
|
||||
(s)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均CPU利用率
|
||||
(%)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
峰值RAM用量
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均RAM用量
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均GPU利用率
|
||||
(%)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
峰值VRAM用量
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均VRAM用量
|
||||
(MB)
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td rowspan="7">
|
||||
PP-StructureV3
|
||||
</td>
|
||||
<td>
|
||||
OCR模型
|
||||
</td>
|
||||
<td>
|
||||
公式识别模型
|
||||
</td>
|
||||
<td>
|
||||
是否启用图表识别模块
|
||||
</td>
|
||||
<td>
|
||||
文本检测max_side_limit
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.77
|
||||
</td>
|
||||
<td>
|
||||
111.4
|
||||
</td>
|
||||
<td>
|
||||
6.7
|
||||
</td>
|
||||
<td>
|
||||
5.2
|
||||
</td>
|
||||
<td>
|
||||
38.9
|
||||
</td>
|
||||
<td>
|
||||
17.0
|
||||
</td>
|
||||
<td>
|
||||
16.5
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✔
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
4.09
|
||||
</td>
|
||||
<td>
|
||||
105.3
|
||||
</td>
|
||||
<td>
|
||||
5.5
|
||||
</td>
|
||||
<td>
|
||||
4.0
|
||||
</td>
|
||||
<td>
|
||||
24.7
|
||||
</td>
|
||||
<td>
|
||||
17.0
|
||||
</td>
|
||||
<td>
|
||||
16.6
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.56
|
||||
</td>
|
||||
<td>
|
||||
113.7
|
||||
</td>
|
||||
<td>
|
||||
6.6
|
||||
</td>
|
||||
<td>
|
||||
4.9
|
||||
</td>
|
||||
<td>
|
||||
29.1
|
||||
</td>
|
||||
<td>
|
||||
10.7
|
||||
</td>
|
||||
<td>
|
||||
10.6
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.42
|
||||
</td>
|
||||
<td>
|
||||
112.9
|
||||
</td>
|
||||
<td>
|
||||
6.8
|
||||
</td>
|
||||
<td>
|
||||
5.1
|
||||
</td>
|
||||
<td>
|
||||
38
|
||||
</td>
|
||||
<td>
|
||||
16.0
|
||||
</td>
|
||||
<td>
|
||||
15.5
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.15
|
||||
</td>
|
||||
<td>
|
||||
114.8
|
||||
</td>
|
||||
<td>
|
||||
6.5
|
||||
</td>
|
||||
<td>
|
||||
5.0
|
||||
</td>
|
||||
<td>
|
||||
26.1
|
||||
</td>
|
||||
<td>
|
||||
8.4
|
||||
</td>
|
||||
<td>
|
||||
8.3
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
1200
|
||||
</td>
|
||||
<td>
|
||||
0.99
|
||||
</td>
|
||||
<td>
|
||||
113
|
||||
</td>
|
||||
<td>
|
||||
7.0
|
||||
</td>
|
||||
<td>
|
||||
5.6
|
||||
</td>
|
||||
<td>
|
||||
29.2
|
||||
</td>
|
||||
<td>
|
||||
8.6
|
||||
</td>
|
||||
<td>
|
||||
8.5
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
MinerU
|
||||
</td>
|
||||
<td colspan="4">
|
||||
-
|
||||
</td>
|
||||
<td>
|
||||
1.57
|
||||
</td>
|
||||
<td>
|
||||
142.9
|
||||
</td>
|
||||
<td>
|
||||
13.3
|
||||
</td>
|
||||
<td>
|
||||
11.8
|
||||
</td>
|
||||
<td>
|
||||
43.3
|
||||
</td>
|
||||
<td>
|
||||
31.6
|
||||
</td>
|
||||
<td>
|
||||
9.7
|
||||
</td>
|
||||
</tr>
|
||||
</table>
|
||||
|
||||
测试硬件:NVIDIA A100 + Intel Xeon Platinum 8350C
|
||||
|
||||
<table>
|
||||
<colgroup>
|
||||
<col>
|
||||
</colgroup>
|
||||
<tbody>
|
||||
<tr>
|
||||
<td></td>
|
||||
<td>Pipeline Configurations</td>
|
||||
<td>Average time per page (s)</td>
|
||||
<td>Average CPU (%)</td>
|
||||
<td>Peak RAM Usage (MB)</td>
|
||||
<td>Average RAM Usage (MB)</td>
|
||||
<td>Average GPU (%)</td>
|
||||
<td>Peak VRAM Usage (MB)</td>
|
||||
<td>Average VRAM Usage (MB)</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td rowspan="6">PP-StructureV3</td>
|
||||
<td>Basic</td>
|
||||
<td>1.12</td>
|
||||
<td>109.8</td>
|
||||
<td>9418.3</td>
|
||||
<td>7977.9</td>
|
||||
<td>29.8</td>
|
||||
<td>22294</td>
|
||||
<td>21638.4</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use chart recognition pipeline</td>
|
||||
<td>2.76</td>
|
||||
<td>103.7</td>
|
||||
<td>9253.6</td>
|
||||
<td>7840.6</td>
|
||||
<td>24</td>
|
||||
<td>22298</td>
|
||||
<td>21555.3</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec</td>
|
||||
<td>1.04</td>
|
||||
<td>110.7</td>
|
||||
<td>9520.8</td>
|
||||
<td>8034.3</td>
|
||||
<td>22</td>
|
||||
<td>12490</td>
|
||||
<td>12383.1</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-FormulaNet_plus-M</td>
|
||||
<td>0.95</td>
|
||||
<td>111.4</td>
|
||||
<td>9272.9</td>
|
||||
<td>7939.9</td>
|
||||
<td>28.1</td>
|
||||
<td>22350</td>
|
||||
<td>21498.4</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec + PP-FormulaNet_plus-M</td>
|
||||
<td>0.89</td>
|
||||
<td>112.1</td>
|
||||
<td>9457.2</td>
|
||||
<td>8031.5</td>
|
||||
<td>18.5</td>
|
||||
<td>11642</td>
|
||||
<td>11433.6</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>Use PP-OCRv5_mobile_det + PP-OCRv5_mobile_rec + PP-FormulaNet_plus-M, and max length of text detection set to 1200</td>
|
||||
<td>0.64</td>
|
||||
<td>113.5</td>
|
||||
<td>10401.1</td>
|
||||
<td>8688.8</td>
|
||||
<td>23.7</td>
|
||||
<td>11716</td>
|
||||
<td>11453.9</td>
|
||||
</tr>
|
||||
<tr">
|
||||
<td>MinerU</td>
|
||||
<td>-</td>
|
||||
<td>1.06</td>
|
||||
<td>168.3</td>
|
||||
<td>18690.4</td>
|
||||
<td>17213.8</td>
|
||||
<td>27.5</td>
|
||||
<td>78760</td>
|
||||
<td>15119</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
### NVIDIA A100 + Intel Xeon Platinum 8350C
|
||||
<table border="1">
|
||||
<tr>
|
||||
<td>
|
||||
方案
|
||||
</td>
|
||||
<td colspan="4">
|
||||
配置
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均每页耗时
|
||||
(s)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均CPU利用率
|
||||
(%)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
峰值RAM用量
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均RAM用量
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均GPU利用率
|
||||
(%)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
峰值VRAM用量
|
||||
(MB)
|
||||
</td>
|
||||
<td rowspan="2">
|
||||
平均VRAM用量
|
||||
(MB)
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td rowspan="7">
|
||||
PP-StructureV3
|
||||
</td>
|
||||
<td>
|
||||
OCR模型
|
||||
</td>
|
||||
<td>
|
||||
公式识别模型
|
||||
</td>
|
||||
<td>
|
||||
是否启用图表识别模块
|
||||
</td>
|
||||
<td>
|
||||
文本检测max_side_limit
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.12
|
||||
</td>
|
||||
<td>
|
||||
109.8
|
||||
</td>
|
||||
<td>
|
||||
9.2
|
||||
</td>
|
||||
<td>
|
||||
7.8
|
||||
</td>
|
||||
<td>
|
||||
29.8
|
||||
</td>
|
||||
<td>
|
||||
21.8
|
||||
</td>
|
||||
<td>
|
||||
21.1
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✔
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
2.76
|
||||
</td>
|
||||
<td>
|
||||
103.7
|
||||
</td>
|
||||
<td>
|
||||
9.0
|
||||
</td>
|
||||
<td>
|
||||
7.7
|
||||
</td>
|
||||
<td>
|
||||
24
|
||||
</td>
|
||||
<td>
|
||||
21.8
|
||||
</td>
|
||||
<td>
|
||||
21.1
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-L
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
1.04
|
||||
</td>
|
||||
<td>
|
||||
110.7
|
||||
</td>
|
||||
<td>
|
||||
9.3
|
||||
</td>
|
||||
<td>
|
||||
7.8
|
||||
</td>
|
||||
<td>
|
||||
22
|
||||
</td>
|
||||
<td>
|
||||
12.2
|
||||
</td>
|
||||
<td>
|
||||
12.1
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Server系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
0.95
|
||||
</td>
|
||||
<td>
|
||||
111.4
|
||||
</td>
|
||||
<td>
|
||||
9.1
|
||||
</td>
|
||||
<td>
|
||||
7.8
|
||||
</td>
|
||||
<td>
|
||||
28.1
|
||||
</td>
|
||||
<td>
|
||||
21.8
|
||||
</td>
|
||||
<td>
|
||||
21.0
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
4096
|
||||
</td>
|
||||
<td>
|
||||
0.89
|
||||
</td>
|
||||
<td>
|
||||
112.1
|
||||
</td>
|
||||
<td>
|
||||
9.2
|
||||
</td>
|
||||
<td>
|
||||
7.8
|
||||
</td>
|
||||
<td>
|
||||
18.5
|
||||
</td>
|
||||
<td>
|
||||
11.4
|
||||
</td>
|
||||
<td>
|
||||
11.2
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
Mobile系列
|
||||
</td>
|
||||
<td>
|
||||
PP-FormulaNet-M
|
||||
</td>
|
||||
<td>
|
||||
✗
|
||||
</td>
|
||||
<td>
|
||||
1200
|
||||
</td>
|
||||
<td>
|
||||
0.64
|
||||
</td>
|
||||
<td>
|
||||
113.5
|
||||
</td>
|
||||
<td>
|
||||
10.2
|
||||
</td>
|
||||
<td>
|
||||
8.5
|
||||
</td>
|
||||
<td>
|
||||
23.7
|
||||
</td>
|
||||
<td>
|
||||
11.4
|
||||
</td>
|
||||
<td>
|
||||
11.2
|
||||
</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>
|
||||
MinerU
|
||||
</td>
|
||||
<td colspan="4">
|
||||
-
|
||||
</td>
|
||||
<td>
|
||||
1.06
|
||||
</td>
|
||||
<td>
|
||||
168.3
|
||||
</td>
|
||||
<td>
|
||||
18.3
|
||||
</td>
|
||||
<td>
|
||||
16.8
|
||||
</td>
|
||||
<td>
|
||||
27.5
|
||||
</td>
|
||||
<td>
|
||||
76.9
|
||||
</td>
|
||||
<td>
|
||||
14.8
|
||||
</td>
|
||||
</tr>
|
||||
</table>
|
||||
|
||||
2. 服务化部署
|
||||
## 3.2 服务化部署
|
||||
|
||||
输入数据:1500张图像,包含表格、公式、印章、图表等元素。
|
||||
使用基础配置。
|
||||
服务化部署测试基于 NVIDIA A100 + Intel Xeon Platinum 8350C 环境,测试数据为 1500 张图像,包含表格、公式、印章、图表等元素。
|
||||
|
||||
<table>
|
||||
<tbody>
|
||||
@ -515,18 +925,18 @@
|
||||
<td>成功请求数/总请求数</td>
|
||||
</tr>
|
||||
<tr">
|
||||
<td>4卡*1</td>
|
||||
<td>4卡 ✖️ 1实例/卡</td>
|
||||
<td>4</td>
|
||||
<td>1.69</td>
|
||||
<td>2.36</td>
|
||||
<td>1</td>
|
||||
<td>100%</td>
|
||||
</tr>
|
||||
<tr">
|
||||
<td>4卡*4</td>
|
||||
<td>4卡 ✖️ 4实例/卡</td>
|
||||
<td>16</td>
|
||||
<td>4.05</td>
|
||||
<td>3.87</td>
|
||||
<td>1</td>
|
||||
<td>100%</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
</table>
|
||||
|
||||
@ -234,6 +234,12 @@ Whether to enable MKL-DNN acceleration for inference. If MKL-DNN is unavailable
|
||||
<td><code>None</code></td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td><code>max_side_limit</code></td>
|
||||
<td>Limit on the max length of the input image for detection.<code>int</code> Limit the longest side of the image for input detection model. If set to <code>None</code>, the default value from the official PaddleOCR model configuration will be used.</td>
|
||||
<td><code>int</code> / <code>None</code></td>
|
||||
<td><code>None</code></td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td><code>thresh</code></td>
|
||||
<td>Pixel score threshold. Pixels in the output probability map with scores greater than this threshold are considered text pixels. Accepts any float value greater than 0. If set to <code>None</code>, the default value from the official PaddleOCR model configuration will be used.</td>
|
||||
<td><code>float</code> / <code>None</code></td>
|
||||
|
||||
@ -235,6 +235,12 @@ for res in output:
|
||||
<td><code>None</code></td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td><code>max_side_limit</code></td>
|
||||
<td>检测的图像边长最大值限制:<code>int</code> 限制输入检测模型的图片最长边,如果设置为<code>None</code>, 将默认使用PaddleOCR官方模型配置中的该参数值。</td>
|
||||
<td><code>int</code> / <code>None</code></td>
|
||||
<td><code>None</code></td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td><code>thresh</code></td>
|
||||
<td>像素得分阈值。输出概率图中得分大于该阈值的像素点被认为是文本像素。可选大于0的float任意浮点数,如果设置为<code>None</code>, 将默认使用PaddleOCR官方模型配置中的该参数值。</td>
|
||||
<td><code>float</code> / <code>None</code></td>
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user