mirror of
https://github.com/PaddlePaddle/PaddleOCR.git
synced 2025-07-30 12:22:10 +00:00

* Fix docs * update performance * update performance * Fix docs * update performance * update performance * Update docs * Update tensorrt docs * update performance * update performance * update performance * update performance * update performance * modify chart recognition * modify seal recognition * Add resource notice * Fix mcp docs * Fix doc * Fix name * update performance * Fix docs * Fix docs * Refactor MCP server docs --------- Co-authored-by: Bobholamovic <mhlin425@whu.edu.cn> Co-authored-by: Bobholamovic <bob1998425@hotmail.com>
45 KiB
45 KiB
comments |
---|
true |
PaddleOCR模型列表(CPU/GPU)
PaddleOCR 内置了多条产线,每条产线都包含了若干模块,每个模块包含若干模型,具体使用哪些模型,您可以根据下边的 benchmark 数据来选择。如您更考虑模型精度,请选择精度较高的模型,如您更考虑模型推理速度,请选择推理速度较快的模型,如您更考虑模型存储大小,请选择存储大小较小的模型。
文本检测模块
模型 | 检测Hmean(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv5_server_det | 83.8 | 89.55 / 70.19 | 383.15 / 383.15 | 101 | PP-OCRv5_server_det.yaml | 推理模型/训练模型 |
PP-OCRv5_mobile_det | 79.0 | 10.67 / 6.36 | 57.77 / 28.15 | 4.7 | PP-OCRv5_mobile_det.yaml | 推理模型/训练模型 |
PP-OCRv4_server_det | 82.56 | 127.82 / 98.87 | 585.95 / 489.77 | 109 | PP-OCRv4_server_det.yaml | 推理模型/训练模型 |
PP-OCRv4_mobile_det | 63.8 | 9.87 / 4.17 | 56.60 / 20.79 | 4.7 | PP-OCRv4_mobile_det.yaml | 推理模型/训练模型 |
PP-OCRv3_mobile_det | 78.68 | 9.90 / 3.60 | 41.93 / 20.76 | 2.1 | PP-OCRv3_mobile_det.yaml | 推理模型/训练模型 |
PP-OCRv3_server_det | 80.11 | 119.50 / 75.00 | 379.35 / 318.35 | 102.1 | PP-OCRv3_server_det.yaml | 推理模型/训练模型 |
印章文本检测模块
模型名称 | 检测Hmean(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv4_mobile_seal_det | 96.36 | 9.70 / 3.56 | 50.38 / 19.64 | 4.7 | PP-OCRv4_mobile_seal_det.yaml | 推理模型/训练模型 |
PP-OCRv4_server_seal_det | 98.40 | 124.64 / 91.57 | 545.68 / 439.86 | 109 | PP-OCRv4_server_seal_det.yaml | 推理模型/训练模型 |
文本识别模块
- 中文识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv5_server_rec | 86.38 | 8.46 / 2.36 | 31.21 / 31.21 | 81 | PP-OCRv5_server_rec.yaml | 推理模型/训练模型 |
PP-OCRv5_mobile_rec | 81.29 | 5.43 / 1.46 | 21.20 / 5.32 | 16 | PP-OCRv5_mobile_rec.yaml | 推理模型/训练模型 |
PP-OCRv4_server_rec_doc | 86.58 | 8.69 / 2.78 | 37.93 / 37.93 | 182 | PP-OCRv4_server_rec_doc.yaml | 推理模型/训练模型 |
PP-OCRv4_mobile_rec | 78.74 | 5.26 / 1.12 | 17.48 / 3.61 | 10.5 | PP-OCRv4_mobile_rec.yaml | 推理模型/训练模型 |
PP-OCRv4_server_rec | 85.19 | 8.75 / 2.49 | 36.93 / 36.93 | 173 | PP-OCRv4_server_rec.yaml | 推理模型/训练模型 |
PP-OCRv3_mobile_rec | 72.96 | 3.89 / 1.16 | 8.72 / 3.56 | 10.3 | PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 8367 张图片。
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
ch_SVTRv2_rec | 68.81 | 10.38 / 8.31 | 66.52 / 30.83 | 80.5 | ch_SVTRv2_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务A榜。
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
ch_RepSVTR_rec | 65.07 | 6.29 / 1.57 | 20.64 / 5.40 | 48.8 | ch_RepSVTR_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务B榜。
- 英文识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
en_PP-OCRv4_mobile_rec | 70.39 | 4.81 / 1.23 | 17.20 / 4.18 | 7.5 | en_PP-OCRv4_mobile_rec.yaml | 推理模型/训练模型 |
en_PP-OCRv3_mobile_rec | 70.69 | 3.56 / 0.78 | 8.44 / 5.78 | 17.3 | en_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的英文数据集。
- 多语言识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
korean_PP-OCRv3_mobile_rec | 60.21 | 3.73 / 0.98 | 8.76 / 2.91 | 9.6 | korean_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
japan_PP-OCRv3_mobile_rec | 45.69 | 3.86 / 1.01 | 8.62 / 2.92 | 9.8 | japan_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
chinese_cht_PP-OCRv3_mobile_rec | 82.06 | 3.90 / 1.16 | 9.24 / 3.18 | 10.8 | chinese_cht_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
te_PP-OCRv3_mobile_rec | 95.88 | 3.59 / 0.81 | 8.28 / 6.21 | 8.7 | te_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
ka_PP-OCRv3_mobile_rec | 96.96 | 3.49 / 0.89 | 8.63 / 2.77 | 17.4 | ka_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
ta_PP-OCRv3_mobile_rec | 76.83 | 3.49 / 0.86 | 8.35 / 3.41 | 8.7 | ta_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
latin_PP-OCRv3_mobile_rec | 76.93 | 3.53 / 0.78 | 8.50 / 6.83 | 8.7 | latin_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
arabic_PP-OCRv3_mobile_rec | 73.55 | 3.60 / 0.83 | 8.44 / 4.69 | 17.3 | arabic_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
cyrillic_PP-OCRv3_mobile_rec | 94.28 | 3.56 / 0.79 | 8.22 / 2.76 | 8.7 | cyrillic_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
devanagari_PP-OCRv3_mobile_rec | 96.44 | 3.60 / 0.78 | 6.95 / 2.87 | 8.7 | devanagari_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的多语种数据集。
公式识别模块
模型 | En-BLEU(%) | Zh-BLEU(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|---|
UniMERNet | 85.91 | 43.50 | 1311.84 / 1311.84 | - / 8288.07 | 1530 | UniMERNet.yaml | 推理模型/训练模型 |
PP-FormulaNet-S | 87.00 | 45.71 | 182.25 / 182.25 | - / 254.39 | 224 | PP-FormulaNet-S.yaml | 推理模型/训练模型 |
PP-FormulaNet-L | 90.36 | 45.78 | 1482.03 / 1482.03 | - / 3131.54 | 695 | PP-FormulaNet-L.yaml | 推理模型/训练模型 |
PP-FormulaNet_plus-S | 88.71 | 53.32 | 179.20 / 179.20 | - / 260.99 | 248 | PP-FormulaNet_plus-S.yaml | 推理模型/训练模型 |
PP-FormulaNet_plus-M | 91.45 | 89.76 | 1040.27 / 1040.27 | - / 1615.80 | 592 | PP-FormulaNet_plus-M.yaml | 推理模型/训练模型 |
PP-FormulaNet_plus-L | 92.22 | 90.64 | 1476.07 / 1476.07 | - / 3125.58 | 698 | PP-FormulaNet_plus-L.yaml | 推理模型/训练模型 |
LaTeX_OCR_rec | 74.55 | 39.96 | 1088.89 / 1088.89 | - / - | 99 | LaTeX_OCR_rec.yaml | 推理模型/训练模型 |
表格结构识别模块
模型 | 精度(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
SLANet | 59.52 | 23.96 / 21.75 | - / 43.12 | 6.9 | SLANet.yaml | 推理模型/训练模型 |
SLANet_plus | 63.69 | 23.43 / 22.16 | - / 41.80 | 6.9 | SLANet_plus.yaml | 推理模型/训练模型 |
SLANeXt_wired | 69.65 | 85.92 / 85.92 | - / 501.66 | 351 | SLANeXt_wired.yaml | 推理模型/训练模型 |
SLANeXt_wireless | SLANeXt_wireless.yaml | 推理模型/训练模型 |
表格单元格检测模块
模型 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
RT-DETR-L_wired_table_cell_det | 82.7 | 33.47 / 27.02 | 402.55 / 256.56 | 124 | RT-DETR-L_wired_table_cell_det.yaml | 推理模型/训练模型 |
RT-DETR-L_wireless_table_cell_det | RT-DETR-L_wireless_table_cell_det.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建表格单元格检测数据集。
表格分类模块
模型 | Top1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_table_cls | 94.2 | 2.62 / 0.60 | 3.17 / 1.14 | 6.6 | PP-LCNet_x1_0_table_cls.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建表格分类数据集。
文本图像矫正模块
模型名称 | CER | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
UVDoc | 0.179 | 19.05 / 19.05 | - / 869.82 | 30.3 | UVDoc.yaml | 推理模型/训练模型 |
版面区域检测模块
- 版面检测模型,包含20个常见的类别:文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、表格、图和表标题(图标题、表格标题和图表标题)、印章、图表、侧栏文本和参考文献内容
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-DocLayout_plus-L | 83.2 | 53.03 / 17.23 | 634.62 / 378.32 | 126.01 | PP-DocLayout_plus-L.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1300 张文档类型图片。
- 文档图像版面子模块检测,包含1个 版面区域 类别,能检测多栏的报纸、杂志的每个子文章的文本区域:
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-DocBlockLayout | 95.9 | 34.60 / 28.54 | 506.43 / 256.83 | 123.92 | PP-DocBlockLayout.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的版面子区域检测数据集,包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1000 张文档类型图片。
- 版面检测模型,包含23个常见的类别:文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、图表标题、表格、表格标题、印章、图表标题、图表、页眉图像、页脚图像、侧栏文本
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-DocLayout-L | 90.4 | 33.59 / 33.59 | 503.01 / 251.08 | 123.76 | PP-DocLayout-L.yaml | 推理模型/训练模型 |
PP-DocLayout-M | 75.2 | 13.03 / 4.72 | 43.39 / 24.44 | 22.578 | PP-DocLayout-M.yaml | 推理模型/训练模型 |
PP-DocLayout-S | 70.9 | 11.54 / 3.86 | 18.53 / 6.29 | 4.834 | PP-DocLayout-S.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 500 张文档类型图片。
- 表格版面检测模型
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet_layout_1x_table | 97.5 | 9.57 / 6.63 | 27.66 / 16.75 | 7.4 | PicoDet_layout_1x_table.yaml | 推理模型/训练模型 |
- 3类版面检测模型,包含表格、图像、印章
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet-S_layout_3cls | 88.2 | 8.43 / 3.44 | 17.60 / 6.51 | 4.8 | PicoDet-S_layout_3cls.yaml | 推理模型/训练模型 |
PicoDet-L_layout_3cls | 89.0 | 12.80 / 9.57 | 45.04 / 23.86 | 22.6 | PicoDet-L_layout_3cls.yaml | 推理模型/训练模型 |
RT-DETR-H_layout_3cls | 95.8 | 114.80 / 25.65 | 924.38 / 924.38 | 470.1 | RT-DETR-H_layout_3cls.yaml | 推理模型/训练模型 |
- 5类英文文档区域检测模型,包含文字、标题、表格、图片以及列表
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet_layout_1x | 97.8 | 9.62 / 6.75 | 26.96 / 12.77 | 7.4 | PicoDet_layout_1x.yaml | 推理模型/训练模型 |
- 17类区域检测模型,包含17个版面常见类别,分别是:段落标题、图片、文本、数字、摘要、内容、图表标题、公式、表格、表格标题、参考文献、文档标题、脚注、页眉、算法、页脚、印章
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet-S_layout_17cls | 87.4 | 8.80 / 3.62 | 17.51 / 6.35 | 4.8 | PicoDet-S_layout_17cls.yaml | 推理模型/训练模型 |
PicoDet-L_layout_17cls | 89.0 | 12.60 / 10.27 | 43.70 / 24.42 | 22.6 | PicoDet-L_layout_17cls.yaml | 推理模型/训练模型 |
RT-DETR-H_layout_17cls | 98.3 | 115.29 / 101.18 | 964.75 / 964.75 | 470.2 | RT-DETR-H_layout_17cls.yaml | 推理模型/训练模型 |
文档图像方向分类模块
模型 | Top-1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_doc_ori | 99.06 | 2.62 / 0.59 | 3.24 / 1.19 | 7 | PP-LCNet_x1_0_doc_ori.yaml | 推理模型/训练模型 |
文本行方向分类模块
模型 | Top-1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_doc_ori | 99.06 | 2.62 / 0.59 | 3.24 / 1.19 | 7 | PP-LCNet_x0_25_textline_ori.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。
文档类视觉语言模型模块
模型 | 模型参数尺寸(B) | 模型存储大小(GB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|
PP-DocBee-2B | 2 | 4.2 | PP-DocBee-2B.yaml | 推理模型 |
PP-DocBee-7B | 7 | 15.8 | PP-DocBee-7B.yaml | 推理模型 |
PP-DocBee2-3B | 3 | 7.6 | 推理模型 |