Update for 3.2 (#16297)

* update for 3.1.1

* update for 3.2

* update readme
This commit is contained in:
cuicheng01 2025-08-21 17:07:46 +08:00 committed by GitHub
parent 38ea6347fa
commit 97fc834cfe
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194
11 changed files with 406 additions and 3 deletions

View File

@ -65,8 +65,57 @@ In addition to providing an outstanding model library, PaddleOCR 3.0 also offers
## 📣 Recent updates
### 🔥🔥2025.08.21: Release of PaddleOCR 3.2.0, includes:
#### **2025.06.29: Release of PaddleOCR 3.1.0**, includes:
- **Significant Model Additions:**
- Introduced training, inference, and deployment for PP-OCRv5 recognition models in English, Thai, and Greek. **The PP-OCRv5 English model delivers an 11% improvement in English scenarios compared to the main PP-OCRv5 model, with the Thai and Greek recognition models achieving accuracies of 82.68% and 89.28%, respectively.**
- **Deployment Capability Upgrades:**
- **Full support for PaddlePaddle framework versions 3.1.0 and 3.1.1.**
- **Comprehensive upgrade of the PP-OCRv5 C++ local deployment solution, now supporting both Linux and Windows, with feature parity and identical accuracy to the Python implementation.**
- **High-performance inference now supports CUDA 12, and inference can be performed using either the Paddle Inference or ONNX Runtime backends.**
- **The high-stability service-oriented deployment solution is now fully open-sourced, allowing users to customize Docker images and SDKs as required.**
- The high-stability service-oriented deployment solution also supports invocation via manually constructed HTTP requests, enabling client-side code development in any programming language.
- **Benchmark Support:**
- **All production lines now support fine-grained benchmarking, enabling measurement of end-to-end inference time as well as per-layer and per-module latency data to assist with performance analysis.**
- **Documentation has been updated to include key metrics for commonly used configurations on mainstream hardware, such as inference latency and memory usage, providing deployment references for users.**
- **Bug Fixes:**
- Resolved the issue of failed log saving during model training.
- Upgraded the data augmentation component for formula models for compatibility with newer versions of the albumentations dependency, and fixed deadlock warnings when using the tokenizers package in multi-process scenarios.
- Fixed inconsistencies in switch behaviors (e.g., `use_chart_parsing`) in the PP-StructureV3 configuration files compared to other pipelines.
- **Other Enhancements:**
- **Separated core and optional dependencies. Only minimal core dependencies are required for basic text recognition; additional dependencies for document parsing and information extraction can be installed as needed.**
- **Enabled support for NVIDIA RTX 50 series graphics cards on Windows; users can refer to the [installation guide](docs/version3.x/installation.en.md) for the corresponding PaddlePaddle framework versions.**
- **PP-OCR series models now support returning single-character coordinates.**
- Added AIStudio, ModelScope, and other model download sources, allowing users to specify the source for model downloads.
- Added support for chart-to-table conversion via the PP-Chart2Table module.
- Optimized documentation descriptions to improve usability.
<details>
<summary><strong>2025.08.15: PaddleOCR 3.1.1 Released</strong></summary>
- **Bug Fixes:**
- Added the missing methods `save_vector`, `save_visual_info_list`, `load_vector`, and `load_visual_info_list` in the `PP-ChatOCRv4` class.
- Added the missing parameters `glossary` and `llm_request_interval` to the `translate` method in the `PPDocTranslation` class.
- **Documentation Improvements:**
- Added a demo to the MCP documentation.
- Added information about the PaddlePaddle and PaddleOCR version used for performance metrics testing in the documentation.
- Fixed errors and omissions in the production line document translation.
- **Others:**
- Changed the MCP server dependency to use the pure Python library `puremagic` instead of `python-magic` to reduce installation issues.
- Retested PP-OCRv5 performance metrics with PaddleOCR version 3.1.0 and updated the documentation.
</details>
<details>
<summary><strong>2025.06.29: PaddleOCR 3.1.0 Released</strong></summary>
- **Key Models and Pipelines:**
- **Added PP-OCRv5 Multilingual Text Recognition Model**, which supports the training and inference process for text recognition models in 37 languages, including French, Spanish, Portuguese, Russian, Korean, etc. **Average accuracy improved by over 30%.** [Details](https://paddlepaddle.github.io/PaddleOCR/latest/en/version3.x/algorithm/PP-OCRv5/PP-OCRv5_multi_languages.html)
@ -81,6 +130,8 @@ In addition to providing an outstanding model library, PaddleOCR 3.0 also offers
- **Documentation Optimization:** Improved the descriptions in some user guides for a smoother reading experience.
</details>
<details>
<summary><strong>2025.06.26: PaddleOCR 3.0.3 Released</strong></summary>
- Bug Fix: Resolved the issue where the `enable_mkldnn` parameter was not effective, restoring the default behavior of using MKL-DNN for CPU inference.

View File

@ -7,6 +7,37 @@ hide:
### Recently Update
#### 🔥🔥**2025.08.21: Release of PaddleOCR 3.2.0**, includes:
- **Significant Model Additions:**
- Introduced training, inference, and deployment for PP-OCRv5 recognition models in English, Thai, and Greek. **The PP-OCRv5 English model delivers an 11% improvement in English scenarios compared to the main PP-OCRv5 model, with the Thai and Greek recognition models achieving accuracies of 82.68% and 89.28%, respectively.**
- **Deployment Capability Upgrades:**
- **Full support for PaddlePaddle framework versions 3.1.0 and 3.1.1.**
- **Comprehensive upgrade of the PP-OCRv5 C++ local deployment solution, now supporting both Linux and Windows, with feature parity and identical accuracy to the Python implementation.**
- **High-performance inference now supports CUDA 12, and inference can be performed using either the Paddle Inference or ONNX Runtime backends.**
- **The high-stability service-oriented deployment solution is now fully open-sourced, allowing users to customize Docker images and SDKs as required.**
- The high-stability service-oriented deployment solution also supports invocation via manually constructed HTTP requests, enabling client-side code development in any programming language.
- **Benchmark Support:**
- **All production lines now support fine-grained benchmarking, enabling measurement of end-to-end inference time as well as per-layer and per-module latency data to assist with performance analysis.**
- **Documentation has been updated to include key metrics for commonly used configurations on mainstream hardware, such as inference latency and memory usage, providing deployment references for users.**
- **Bug Fixes:**
- Resolved the issue of failed log saving during model training.
- Upgraded the data augmentation component for formula models for compatibility with newer versions of the albumentations dependency, and fixed deadlock warnings when using the tokenizers package in multi-process scenarios.
- Fixed inconsistencies in switch behaviors (e.g., `use_chart_parsing`) in the PP-StructureV3 configuration files compared to other pipelines.
- **Other Enhancements:**
- **Separated core and optional dependencies. Only minimal core dependencies are required for basic text recognition; additional dependencies for document parsing and information extraction can be installed as needed.**
- **Enabled support for NVIDIA RTX 50 series graphics cards on Windows; users can refer to the [installation guide](../version3.x/installation.en.md) for the corresponding PaddlePaddle framework versions.**
- **PP-OCR series models now support returning single-character coordinates.**
- Added AIStudio, ModelScope, and other model download sources, allowing users to specify the source for model downloads.
- Added support for chart-to-table conversion via the PP-Chart2Table module.
- Optimized documentation descriptions to improve usability.
#### **2025.08.15: Release of PaddleOCR 3.1.1**, includes:
- **Bug Fixes:**

View File

@ -7,6 +7,35 @@ hide:
### 更新
#### 2025.08.21: **PaddleOCR 3.2.0** 发布,新增能力如下:
- **重要模型新增:**
- 新增 PP-OCRv5 英文、泰文、希腊文识别模型的训练、推理、部署。**其中 PP-OCRv5 英文模型较 PP-OCRv5 主模型在英文场景提升 11%,泰文识别模型精度 82.68%,希腊文识别模型精度 89.28%。**
- **部署能力升级:**
- **全面支持飞桨框架 3.1.0 和 3.1.1 版本。**
- **全面升级 PP-OCRv5 C++ 本地部署方案,支持 Linux、Windows功能及精度效果与 Python 方案保持一致。**
- **高性能推理支持 CUDA 12可使用 Paddle Inference、ONNX Runtime 后端推理。**
- **高稳定性服务化部署方案全面开源,支持用户根据需求对 Docker 镜像和 SDK 进行定制化修改。**
- 高稳定性服务化部署方案支持通过手动构造HTTP请求的方式调用该方式允许客户端代码使用任意编程语言编写。
- **Benchmark支持**
- **全部产线支持产线细粒度 benchmark能够测量产线端到端推理时间以及逐层、逐模块的耗时数据可用于辅助产线性能分析。**
- **文档中补充各产线常用配置在主流硬件上的关键指标,包括推理耗时和内存占用等,为用户部署提供参考。**
- **Bug修复**
- 修复模型训练时训练日志保存失败的问题。
- 对公式模型的数据增强部分进行了版本兼容性升级,以适应新版本的 albumentations 依赖,并修复了在多进程使用 tokenizers 依赖包时出现的死锁警告。
- 修复 PP-StructureV3 配置文件中的 `use_chart_parsing` 等开关行为与其他产线不统一的问题。
- **其他升级:**
- **分离必要依赖与可选依赖。使用基础文字识别功能时,仅需安装少量核心依赖;若需文档解析、信息抽取等功能,用户可按需选择安装额外依赖。**
- **支持 Windows 用户使用英伟达 50 系显卡,可根据 [安装文档](../docs/version3.x/installation.md) 安装对应版本的 paddle 框架。**
- **PP-OCR 系列模型支持返回单文字坐标。**
- 模型新增 AIStudio、ModelScope 等下载源。可指定相关下载源下载对应的模型。
- 支持图表转表PP-Chart2Table单功能模块推理能力。
- 优化部分使用文档中的描述,提升易用性。
#### 2025.08.15: **PaddleOCR 3.1.1** 发布,新增能力如下:
- **bug修复**

View File

@ -50,6 +50,84 @@
## 📣 آخر التحديثات
<h4 dir="rtl"><strong>2025.08.21: إصدار <bdi dir="ltr">PaddleOCR 3.2.0</bdi>، يتضمن:</strong></h4>
<ul dir="rtl">
<li><strong>تحديثات النماذج الرئيسية:</strong>
<ul dir="rtl">
<li>
تمت إضافة ميزات التدريب والاستدلال والنشر لنماذج التعرف <bdi dir="ltr">PP-OCRv5</bdi> للغات الإنجليزية والتايلاندية واليونانية.
<br>
<bdi dir="ltr">النموذج الإنجليزي</bdi> حقق زيادة بنسبة 11% في الدقة مقارنة بالإصدار السابق من <bdi dir="ltr">PP-OCRv5</bdi> في سيناريوهات اللغة الإنجليزية.
<bdi dir="ltr">النموذج التايلاندي</bdi> حقق دقة بنسبة 82.68%،
و<bdi dir="ltr">النموذج اليوناني</bdi> حقق دقة بنسبة 89.28%.
</li>
</ul>
</li>
<li><strong>تحسين إمكانيات النشر:</strong>
<ul dir="rtl">
<li>
<bdi dir="ltr">دعم كامل لإصداري PaddlePaddle 3.1.0 و 3.1.1.</bdi>
</li>
<li>
<bdi dir="ltr">إعادة هيكلة كاملة لحل النشر المحلي بلغة C++، متوافق مع Linux و Windows، ليحقق نفس الوظائف والدقة كما في إصدار Python.</bdi>
</li>
<li>
<bdi dir="ltr">دعم CUDA 12</bdi> للاستدلال عالي الأداء، مع خيار استخدام <bdi dir="ltr">Paddle Inference</bdi> أو <bdi dir="ltr">ONNX Runtime</bdi>.
</li>
<li>
<bdi dir="ltr">إتاحة الشيفرة المصدرية بالكامل</bdi> لحل النشر كخدمة عالية الاستقرار، مما يمكن المستخدمين من تخصيص صور Docker أو SDK حسب احتياجاتهم.
</li>
<li>
يدعم حل النشر كخدمة عالية الاستقرار أيضاً استدعاءات HTTP يدوياً، مما يسمح للعملاء بالنشر بأي لغة.
</li>
</ul>
</li>
<li><strong>دعم مؤشرات الأداء:</strong>
<ul dir="rtl">
<li>
<bdi dir="ltr">توفير وظيفة مؤشرات أداء مفصلة</bdi> عبر سلسلة الإنتاج بالكامل، لقياس زمن الاستدلال من البداية للنهاية وأزمنة تنفيذ الطبقات والوحدات المختلفة، لتسهيل تحليل الأداء.
</li>
<li>
<bdi dir="ltr">توفر الوثائق القيم المرجعية (زمن الاستدلال، استهلاك الذاكرة، إلخ) على أهم منصات العتاد</bdi> لمساعدة المستخدمين في اتخاذ قرارات النشر.
</li>
</ul>
</li>
<li><strong>تصحيح الأخطاء:</strong>
<ul dir="rtl">
<li>
تم حل مشكلة عدم حفظ السجلات أثناء تدريب النموذج.
</li>
<li>
<bdi dir="ltr">تكييف جزء زيادة البيانات لنموذج المعادلات مع إصدار albumentations الجديد</bdi> وحل تحذير التعليق المحتمل عند استخدام tokenizers في تعدد العمليات.
</li>
<li>
<bdi dir="ltr">تصحيح عدم تطابق بعض الإشارات مثل use_chart_parsing في ملف إعدادات PP-StructureV3 مقارنة بإصدارات أخرى.</bdi>
</li>
</ul>
</li>
<li><strong>تحديثات أخرى:</strong>
<ul dir="rtl">
<li>
<bdi dir="ltr">فصل التبعيات الأساسية عن الاختيارية؛ وظائف التعرف الأساسية تتطلب فقط الحد الأدنى من التبعيات، بينما يمكن تثبيت ميزات إضافية مثل تحليل الوثائق أو استخراج المعلومات حسب الحاجة.</bdi>
</li>
<li>
<bdi dir="ltr">دعم وحدات معالجة الرسومات NVIDIA السلسلة 50 في بيئة Windows، يرجى مراجعة <a href="../docs/version3.x/installation.en.md">دليل التثبيت</a> لاختيار إصدار Paddle المناسب.</bdi>
</li>
<li>
<bdi dir="ltr">نماذج سلسلة PP-OCR تدعم الآن إرجاع إحداثيات كل حرف.</bdi>
</li>
<li>
تمت إضافة مصادر تحميل النماذج مثل AIStudio وModelScope، مع إمكانية الاختيار بينها.
</li>
<li>
دعم الاستدلال لوحدة تحويل الرسومات إلى جداول <bdi dir="ltr">PP-Chart2Table</bdi>.
</li>
<li>
<bdi dir="ltr">تحسين بعض الأوصاف في الوثائق لتعزيز سهولة الاستخدام.</bdi>
</li>
</ul>
</li>
</ul>
<h4 dir="rtl"><strong>2025.08.15: إصدار <bdi dir="ltr">PaddleOCR 3.1.1</bdi>، يتضمن:</strong></h4>
<ul dir="rtl">

View File

@ -67,7 +67,39 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
## 📣 最新动态
2025.08.15: **PaddleOCR 3.1.1** 发布,包含:
### 🔥🔥2025.08.21: PaddleOCR 3.2.0 发布,包含:
- **重要模型新增:**
- 新增 PP-OCRv5 英文、泰文、希腊文识别模型的训练、推理、部署。**其中 PP-OCRv5 英文模型较 PP-OCRv5 主模型在英文场景提升 11%,泰文识别模型精度 82.68%,希腊文识别模型精度 89.28%。**
- **部署能力升级:**
- **全面支持飞桨框架 3.1.0 和 3.1.1 版本。**
- **全面升级 PP-OCRv5 C++ 本地部署方案,支持 Linux、Windows功能及精度效果与 Python 方案保持一致。**
- **高性能推理支持 CUDA 12可使用 Paddle Inference、ONNX Runtime 后端推理。**
- **高稳定性服务化部署方案全面开源,支持用户根据需求对 Docker 镜像和 SDK 进行定制化修改。**
- 高稳定性服务化部署方案支持通过手动构造HTTP请求的方式调用该方式允许客户端代码使用任意编程语言编写。
- **Benchmark支持**
- **全部产线支持产线细粒度 benchmark能够测量产线端到端推理时间以及逐层、逐模块的耗时数据可用于辅助产线性能分析。**
- **文档中补充各产线常用配置在主流硬件上的关键指标,包括推理耗时和内存占用等,为用户部署提供参考。**
- **Bug修复**
- 修复模型训练时训练日志保存失败的问题。
- 对公式模型的数据增强部分进行了版本兼容性升级,以适应新版本的 albumentations 依赖,并修复了在多进程使用 tokenizers 依赖包时出现的死锁警告。
- 修复 PP-StructureV3 配置文件中的 `use_chart_parsing` 等开关行为与其他产线不统一的问题。
- **其他升级:**
- **分离必要依赖与可选依赖。使用基础文字识别功能时,仅需安装少量核心依赖;若需文档解析、信息抽取等功能,用户可按需选择安装额外依赖。**
- **支持 Windows 用户使用英伟达 50 系显卡,可根据 [安装文档](../docs/version3.x/installation.md) 安装对应版本的 paddle 框架。**
- **PP-OCR 系列模型支持返回单文字坐标。**
- 模型新增 AIStudio、ModelScope 等下载源。可指定相关下载源下载对应的模型。
- 支持图表转表 PP-Chart2Table 单功能模块推理能力。
- 优化部分使用文档中的描述,提升易用性。
<details>
<summary><strong>2025.08.15: PaddleOCR 3.1.1 发布</strong></summary>
- **bug修复**
- 补充 `PP-ChatOCRv4` 类缺失的`save_vector``save_visual_info_list``load_vector、load_visual_info_list` 方法。
@ -81,8 +113,11 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
- **其他:**
- 修改 MCP 服务器依赖,使用纯 Python 库 `puremagic` 代替 `python-magic`,减少安装问题。
- 使用 3.1.0 版本 PaddleOCR 重新测试 PP-OCRv5 性能指标,更新文档。
</details>
2025.06.29: **PaddleOCR 3.1.0** 发布,新增能力如下:
<details>
<summary><strong>2025.06.26: PaddleOCR 3.0.3 发布</strong></summary>
- **重要模型和产线:**
- **新增 PP-OCRv5 多语种文本识别模型**,支持法语、西班牙语、葡萄牙语、俄语、韩语等 37 种语言的文字识别模型的训推流程。**平均精度涨幅超30%。**[详情](https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/algorithm/PP-OCRv5/PP-OCRv5_multi_languages.html)
@ -95,6 +130,7 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
- 支持通过 stdio 调用本地服务,通过 Streamable HTTP 调用远程服务。
- **文档优化:** 优化了部分使用文档描述,提升阅读体验。
</details>
<details>
<summary><strong>2025.06.26: PaddleOCR 3.0.3 发布</strong></summary>

View File

@ -44,6 +44,35 @@ Además de proporcionar una excelente biblioteca de modelos, PaddleOCR 3.0 tambi
## 📣 Últimas actualizaciones
#### **🔥🔥2025.08.21: Lanzamiento de PaddleOCR 3.1.1**, incluye:
- **Actualización de los modelos principales:**
- Se añaden funciones de entrenamiento, inferencia y despliegue para los modelos de reconocimiento PP-OCRv5 en inglés, tailandés y griego. **El modelo en inglés logra una mejora del 11% en precisión en comparación con la versión anterior de PP-OCRv5 en escenarios en inglés; el modelo en tailandés alcanza una precisión del 82,68% y el griego del 89,28%.**
- **Mejoras en las capacidades de despliegue:**
- **Soporte completo para PaddlePaddle 3.1.0 y 3.1.1.**
- **Reforma completa de la solución de despliegue local en C++, compatible con Linux y Windows, alcanzando la misma funcionalidad y precisión que la versión en Python.**
- **Soporte para CUDA 12 para inferencia de alto rendimiento, con opción de usar los backends Paddle Inference u ONNX Runtime.**
- **Apertura total del código fuente de la solución de despliegue tipo servicio de alta estabilidad, permitiendo a los usuarios personalizar imágenes de Docker o SDK según sus necesidades.**
- El despliegue tipo servicio de alta estabilidad también soporta llamadas HTTP manuales, lo que permite a los clientes implementar en cualquier lenguaje.
- **Soporte de benchmarks:**
- **Se proporciona una función detallada de benchmark en toda la cadena de producción, permitiendo medir el tiempo de inferencia de extremo a extremo y los tiempos de ejecución de diferentes capas y módulos, facilitando el análisis de rendimiento.**
- **La documentación incluye valores de referencia (tiempo de inferencia, uso de memoria, etc.) en las principales plataformas de hardware para ayudar a los usuarios a tomar decisiones de despliegue.**
- **Corrección de errores:**
- Corrección del problema por el cual no se guardaban los registros durante el entrenamiento del modelo.
- Adaptación de la parte de aumento de datos del modelo matemático a la nueva versión de albumentations, y solución de la advertencia de posible deadlock al utilizar tokenizers en multiproceso.
- Corrección de las inconsistencias en el comportamiento de banderas como `use_chart_parsing` en el archivo de configuración de PP-StructureV3 respecto a otras producciones.
- **Otras actualizaciones:**
- **Separación de dependencias obligatorias y opcionales; las funciones básicas de reconocimiento requieren solo las dependencias mínimas, mientras que funciones adicionales como análisis de documentos o extracción de información pueden instalarse según necesidad.**
- **Soporte para GPU serie 50 de NVIDIA en entorno Windows, consulte la [guía de instalación](../docs/version3.x/installation.en.md) para elegir la versión de Paddle adecuada.**
- **Los modelos de la serie PP-OCR ahora pueden devolver las coordenadas de cada carácter.**
- Se añaden fuentes de descarga de modelos como AIStudio y ModelScope, permitiendo su selección.
- Soporte para la inferencia del módulo de conversión de gráficos a tablas (PP-Chart2Table).
- Optimización de algunas descripciones en la documentación para mejorar la facilidad de uso.
#### **2025.08.15: Lanzamiento de PaddleOCR 3.1.1**, incluye:
- **Corrección de errores:**

View File

@ -43,6 +43,34 @@ En plus de fournir une bibliothèque de modèles exceptionnelle, PaddleOCR 3.0 p
**Remarque spéciale** : PaddleOCR 3.x introduit plusieurs changements importants dinterface. **L'ancien code écrit sur la base de PaddleOCR 2.x est probablement incompatible avec PaddleOCR 3.x**. Veuillez vous assurer que la documentation que vous consultez correspond à la version de PaddleOCR que vous utilisez. [Ce document](https://paddlepaddle.github.io/PaddleOCR/latest/en/update/upgrade_notes.html) explique les raisons de la mise à niveau et les principaux changements entre PaddleOCR 2.x et 3.x.
## 📣 Mises à jour récentes
#### **🔥🔥21/08/2025 : Sortie de PaddleOCR 3.2.0**, comprend :
- **Ajouts majeurs de modèles :**
- Ajout de lentraînement, de linférence et du déploiement des modèles de reconnaissance PP-OCRv5 en anglais, thaï et grec. **Le modèle anglais PP-OCRv5 offre une amélioration de 11 % dans les scénarios anglophones par rapport au modèle principal PP-OCRv5, tandis que les modèles de reconnaissance thaï et grec atteignent respectivement des précisions de 82,68 % et 89,28 %.**
- **Améliorations des capacités de déploiement :**
- **Support complet des versions 3.1.0 et 3.1.1 du framework PaddlePaddle.**
- **Mise à niveau complète de la solution de déploiement local PP-OCRv5 en C++ : compatible Linux et Windows, avec des fonctionnalités et une précision identiques à la version Python.**
- **Prise en charge des inférences haute performance via CUDA 12, avec possibilité dutiliser Paddle Inference ou le backend ONNX Runtime.**
- **La solution de déploiement orientée service, hautement stable, est désormais entièrement open source, permettant aux utilisateurs de personnaliser les images Docker et les SDK selon leurs besoins.**
- Cette solution prend également en charge lappel via des requêtes HTTP construites manuellement, permettant le développement du client dans nimporte quel langage de programmation.
- **Support du benchmark :**
- **Toutes les chaînes de production prennent désormais en charge des benchmarks fins, permettant de mesurer le temps dinférence de bout en bout ainsi que les temps dexécution par couche et par module, ce qui facilite lanalyse des performances.**
- **La documentation fournit désormais des indicateurs clés (temps dinférence, occupation mémoire, etc.) sur le matériel courant pour différentes configurations, offrant ainsi des références pour le déploiement.**
- **Corrections de bugs :**
- Correction dun problème denregistrement des journaux dentraînement du modèle.
- Mise à jour de la partie augmentation de données du modèle de formule pour garantir la compatibilité avec les nouvelles versions de la dépendance albumentations, et correction dun avertissement de blocage lors de lutilisation du package tokenizers en mode multiprocessus.
- Correction de lincohérence du comportement de certains interrupteurs (comme `use_chart_parsing`) dans les fichiers de configuration de PP-StructureV3 par rapport aux autres chaînes de production.
- **Autres améliorations :**
- **Séparation des dépendances essentielles et optionnelles : seules les dépendances de base sont nécessaires pour la reconnaissance de texte, tandis que les fonctionnalités avancées (analyse documentaire, extraction dinformation, etc.) requièrent linstallation de dépendances supplémentaires selon les besoins.**
- **Prise en charge des cartes graphiques NVIDIA série 50 sous Windows ; les utilisateurs peuvent consulter le [guide dinstallation](../docs/version3.x/installation.en.md) pour installer la version appropriée du framework Paddle.**
- **Les modèles de la série PP-OCR peuvent désormais retourner les coordonnées de chaque caractère individuellement.**
- Ajout de nouvelles sources de téléchargement des modèles, telles quAIStudio et ModelScope, avec la possibilité de spécifier la source désirée.
- Ajout du support pour la conversion de graphique vers tableau via le module PP-Chart2Table.
- Optimisation de certaines descriptions de la documentation pour améliorer la facilité dutilisation.
#### **15/08/2025 : Sortie de PaddleOCR 3.1.1**, comprend :

View File

@ -44,6 +44,37 @@ PaddleOCR 3.0は、優れたモデルライブラリを提供するだけでな
## 📣 最近のアップデート
#### **🔥🔥2025.08.21PaddleOCR 3.2.0 をリリース**、内容は以下の通りです:
- **主要モデルのアップデート:**
- 英語、タイ語、ギリシャ語向けPP-OCRv5認識モデルのトレーニング、推論、デプロイ機能を追加。**英語モデルは英語シナリオで従来のPP-OCRv5対比で11%の精度向上、タイ語モデルの精度は82.68%、ギリシャ語モデルは89.28%を達成。**
- **デプロイ機能の改善:**
- **PaddlePaddle 3.1.0および3.1.1を完全サポート。**
- **C++によるローカルデプロイソリューションを全面刷新、Linux・Windows両方に対応し、Python版と同等の機能・精度を実現。**
- **高性能推論に向けてCUDA 12をサポート、Paddle InferenceまたはONNX Runtimeバックエンドの選択が可能。**
- **高安定性サービス型デプロイソリューションをフルオープンソース化、ユーザー側でDockerイメージやSDKのカスタマイズが可能。**
- 高安定性サービス型デプロイは手動でのHTTPリクエスト呼び出しもサポート、クライアントは任意言語で実装可能。
- **ベンチマークサポート:**
- **全てのプロダクションパイプラインで詳細なベンチマーク機能を提供、エンドツーエンド推論時間やレイヤー・モジュール単位の実行時間を計測可能、性能分析に役立つ。**
- **ドキュメントには、主要なハードウェアプラットフォームでの代表的な設定値(推論時間、メモリ使用量等)を記載、ユーザーのデプロイ判断を支援。**
- **バグ修正:**
- モデル学習時にログが保存されない問題を修正。
- 数式モデルのデータ拡張部分をalbumentations新バージョンに適合、tokenizersのマルチプロセス利用時のデッドロック警告も解決。
- PP-StructureV3の設定ファイルで`use_chart_parsing`等のフラグ挙動が他プロダクションと一致しない問題を修正。
- **その他のアップデート:**
- **必須依存関係とオプション依存関係を分離、基本的な認識機能は最小限の依存関係で利用可能、文書解析や情報抽出等の追加機能はニーズに応じて追加インストール。**
- **Windows環境でNVIDIA 50シリーズGPUをサポート、[インストールガイド](../docs/version3.x/installation.en.md)を参照しPaddleバージョン選択が可能。**
- **PP-OCRシリーズモデルが各文字ごとの座標の返却に対応。**
- モデルダウンロード元としてAIStudio・ModelScope等を追加、選択指定が可能。
- チャートからテーブルへの変換モジュールPP-Chart2Tableの推論もサポート。
- 一部ドキュメントの説明を最適化し、利便性向上。
#### **2025.08.15PaddleOCR 3.1.1 をリリース**、内容は以下の通りです:
- **バグ修正:**

View File

@ -44,6 +44,36 @@ PaddleOCR 3.0은 뛰어난 모델 라이브러리(model library)를 제공할
## 📣 최신 업데이트
#### **🔥🔥2025.08.21: PaddleOCR 3.2.0 출시**, 주요 내용:
- **주요 모델 추가:**
- PP-OCRv5 영어, 태국어, 그리스어 인식 모델의 학습, 추론, 배포 기능 추가. **PP-OCRv5 영어 모델은 영어 환경에서 기존 PP-OCRv5 모델 대비 11% 성능 향상이 있었으며, 태국어 인식 모델 정확도는 82.68%, 그리스어 인식 모델 정확도는 89.28%에 달함.**
- **배포 기능 업그레이드:**
- **PaddlePaddle 프레임워크 3.1.0 및 3.1.1 완전 지원.**
- **PP-OCRv5 C++ 로컬 배포 솔루션 전체 업그레이드, Linux 및 Windows 지원, Python 솔루션과 동일한 기능과 정확도 제공.**
- **고성능 추론을 위해 CUDA 12 지원, Paddle Inference 및 ONNX Runtime 백엔드 사용 가능.**
- **고안정성 서비스형 배포 솔루션 전체 오픈소스화, 사용자가 Docker 이미지 및 SDK를 필요에 따라 커스터마이징 가능.**
- 고안정성 서비스형 배포 솔루션은 수동 HTTP 요청을 통한 호출도 지원, 클라이언트 프로그램은 임의의 언어로 개발 가능.
- **벤치마크 지원:**
- **모든 프로덕션 환경에서 세분화된 벤치마크 지원, 엔드투엔드 추론 시간 및 계층별·모듈별 소요 시간 측정 가능, 성능 분석에 도움.**
- **문서에 주요 하드웨어에서의 일반적인 설정 기준 지표(추론 시간, 메모리 점유 등) 추가, 사용자 배포에 참고 정보 제공.**
- **버그 수정:**
- 모델 학습 시 학습 로그가 저장되지 않는 문제 수정.
- 수식 모델의 데이터 증강 부분을 새 albumentations 버전에 맞게 호환성 업그레이드, tokenizers 패키지 다중 프로세스 사용 시 데드락 경고 문제 해결.
- PP-StructureV3 설정 파일에서 `use_chart_parsing` 등 스위치 동작이 다른 프로덕션과 일치하지 않는 문제 수정.
- **기타 업그레이드:**
- **필수 종속성과 선택 종속성 구분, 기본 문자 인식 기능에는 최소 핵심 종속성만 설치 필요, 문서 파싱이나 정보 추출 등 추가 기능은 필요에 따라 종속성 추가 설치 가능.**
- **Windows 사용자의 NVIDIA 50 시리즈 그래픽카드 지원, [설치 문서](../docs/version3.x/installation.en.md) 참조하여 Paddle 프레임워크 버전 선택 가능.**
- **PP-OCR 시리즈 모델, 글자별 좌표 반환 가능.**
- 모델 다운로드 소스로 AIStudio, ModelScope 등 추가, 원하는 소스 지정 가능.
- 차트-테이블 변환 모듈(PP-Chart2Table) 추론 기능 지원.
- 일부 문서 설명 최적화로 사용성 향상.
#### **2025.08.15: PaddleOCR 3.1.1 출시**, 주요 내용:
- **버그 수정:**

View File

@ -44,6 +44,36 @@
## 📣 Последние обновления
#### **🔥🔥2025.08.21: Выпуск PaddleOCR 3.2.0**, включает:
- **Ключевые обновления моделей:**
- Добавлены обучение, инференс и развертывание моделей распознавания PP-OCRv5 для английского, тайского и греческого языков. **Английская модель PP-OCRv5 обеспечивает прирост точности на 11% в англоязычных сценариях по сравнению с основной моделью PP-OCRv5; точность тайской модели составляет 82,68%, греческой — 89,28%.**
- **Улучшения возможностей развертывания:**
- **Полная поддержка PaddlePaddle 3.1.0 и 3.1.1.**
- **Полное обновление решения для локального развертывания на C++: поддержка Linux и Windows, идентичная функциональность и точность Python-версии.**
- **Высокопроизводительный инференс с поддержкой CUDA 12, возможностью использования Paddle Inference или ONNX Runtime как backend.**
- **Полностью открытый исходный код для высокостабильного сервисного развертывания, позволяющий пользователям настраивать Docker-образы и SDK под свои нужды.**
- Сервисное решение также поддерживает вызовы через вручную сформированные HTTP-запросы, что позволяет реализовывать клиент на любом языке программирования.
- **Поддержка бенчмаркинга:**
- **Все производственные цепочки теперь поддерживают тонкую бенчмаркинг-аналитику: измерение времени инференса end-to-end, а также времени работы по слоям и модулям для анализа производительности.**
- **В документации приведены ключевые показатели (время инференса, использование памяти и др.) для различных конфигураций на популярных аппаратных платформах, чтобы помочь пользователям с развертыванием.**
- **Исправления ошибок:**
- Исправлена проблема, из-за которой не сохранялись логи при обучении моделей.
- Обновлены методы аугментации данных для формульных моделей для совместимости с новыми версиями зависимости albumentations, а также устранено предупреждение о deadlock при использовании библиотеки tokenizers в многопроцессном режиме.
- Исправлено неконсистентное поведение некоторых флагов (например, `use_chart_parsing`) в конфигурационных файлах PP-StructureV3 в сравнении с другими производственными цепочками.
- **Другие улучшения:**
- **Разделены основные и дополнительные зависимости: для базового распознавания достаточно минимального набора зависимостей; для расширенных функций (разбор документов, извлечение информации и др.) дополнительные зависимости можно устанавливать по мере необходимости.**
- **Добавлена поддержка видеокарт серии NVIDIA 50 под Windows. Пользователи могут обратиться к [инструкции по установке](../docs/version3.x/installation.en.md) для выбора подходящей версии Paddle.**
- **Модели серии PP-OCR теперь могут возвращать координаты каждого отдельного символа.**
- Добавлены новые источники загрузки моделей, такие как AIStudio и ModelScope, с возможностью выбора нужного источника.
- Добавлена поддержка модуля преобразования графиков в таблицы (PP-Chart2Table).
- Оптимизированы отдельные описания в документации для повышения удобства использования.
#### **2025.08.15: Выпуск PaddleOCR 3.1.1**, включает:
- **Исправления ошибок:**

View File

@ -40,6 +40,36 @@ PaddleOCR 3.0 **新增**三大特色功能:
## 📣 最新動態
**🔥🔥2025.08.21: 發布 PaddleOCR 3.2.0**,內容包括:
- **重要模型新增:**
- 新增 PP-OCRv5 英文、泰文、希臘文識別模型的訓練、推理、部署。**其中 PP-OCRv5 英文模型在英文場景下較 PP-OCRv5 主模型提升 11%,泰文識別模型準確率達 82.68%,希臘文識別模型準確率達 89.28%。**
- **部署能力升級:**
- **全面支援飛槳PaddlePaddle框架 3.1.0 與 3.1.1 版本。**
- **全面升級 PP-OCRv5 C++ 本地部署方案,支援 Linux、Windows功能及精度與 Python 方案保持一致。**
- **高效能推理支援 CUDA 12可使用 Paddle Inference、ONNX Runtime 後端進行推理。**
- **高穩定性服務化部署方案全面開源,支援用戶根據需求自訂 Docker 映像檔與 SDK。**
- 高穩定性服務化部署方案支援通過手動構造 HTTP 請求的方式調用,允許客戶端程式可用任意程式語言編寫。
- **Benchmark 支援:**
- **所有產線全面支援細粒度 benchmark能測量產線端到端推理時間及逐層、逐模組耗時用於協助產線效能分析。**
- **文件中補充各產線常用配置於主流硬體上的關鍵指標,包括推理耗時、記憶體佔用等,為用戶部署提供參考。**
- **Bug 修復:**
- 修復模型訓練時訓練日誌無法儲存的問題。
- 對公式模型的資料增強部分進行版本相容性升級,以適應新版本 albumentations 依賴,並修復多進程使用 tokenizers 套件時出現的死鎖警告。
- 修復 PP-StructureV3 配置檔案中 `use_chart_parsing` 等開關行為與其他產線不一致的問題。
- **其他升級:**
- **區分必要依賴與可選依賴,使用基礎文字識別功能時僅需安裝少量核心依賴;如需文檔解析、資訊抽取等功能,使用者可按需安裝額外依賴。**
- **支援 Windows 用戶使用 NVIDIA 50 系顯示卡,可依照[安裝文件](../docs/version3.x/installation.md)安裝對應版本的 Paddle 框架。**
- **PP-OCR 系列模型支援返回單字座標。**
- 模型新增 AIStudio、ModelScope 等下載來源,可指定相關來源下載對應模型。
- 支援圖表轉表單一模組PP-Chart2Table推理能力。
- 優化部分使用文件中的描述,提升易用性。
**2025.08.15: 發布 PaddleOCR 3.1.1**,內容包括:
- **Bug修復**