diff --git a/deploy/README_ch.md b/deploy/README_ch.md index 057d387ba8..2e4ed234be 100644 --- a/deploy/README_ch.md +++ b/deploy/README_ch.md @@ -6,6 +6,7 @@ - [PP-OCR 推理部署](#2) + ## Paddle 推理部署方式简介 飞桨提供多种部署方案,以满足不同场景的部署需求,请根据实际情况进行选择: @@ -14,8 +15,8 @@ - + ## PP-OCR 推理部署 PP-OCR模型已打通多种场景部署方案,点击链接获取具体的使用教程。 diff --git a/doc/doc_i18n/README_हिन्द.md b/docs/index.hindi.md similarity index 86% rename from doc/doc_i18n/README_हिन्द.md rename to docs/index.hindi.md index f8ab49ec52..beb9e9edfb 100644 --- a/doc/doc_i18n/README_हिन्द.md +++ b/docs/index.hindi.md @@ -1,5 +1,3 @@ -[English](../../README_en.md) | [简体中文](../../README.md) | हिन्दी | [日本語](./README_日本語.md) | [한국인](./README_한국어.md) | [Pу́сский язы́к](./README_Ру́сский_язы́к.md) -

@@ -13,8 +11,8 @@

- ## प्रस्तावना + पैडलओसीआर का उद्देश्य बहुभाषी,शानदार , ओसीआर और व्यावहारिक ओसीआरउपकरण बनाना है जो यूजर्स को बेहतर मॉडलों के लिए प्रशिक्षित करने और उन्हें व्यवहार में लागू करने में मदद करते हैं।
@@ -24,21 +22,20 @@
-
- ## 📣 हाल के अद्यतन + - **🔥2022.8.24 रिलीज Paddleओसीआर [रिलीज/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** - - रिलीज [PP-Structurev2](../../ppstructure),फंक्शन और परफॉरमेंस के साथ पूरी तरह से उन्नत, चायनीज शीन्स के अनुकूल, और मदद के लिए [लेआउट रिकवरी](../../ppstructure/recovery) और **पीडीएफ को वर्ड में बदलने के लिए वन लाइन कमांड**; - - [लेआउट एनालाइस](../../ppstructure/layout) ऑप्टिमाइजेशन: मॉडल स्टोरेज में 95% की कमी, जबकि स्पीड में 11 गुना वृद्धि , और एवरेज CPU स टाइम-कॉस्ट केवल 41ms है; - - [टेबल रिकोगनाइजेशन](../../ppstructure/table) ऑप्टिमाइजेशन: 3 ऑप्टिमाइज़ेशन के तरीके डिजाइन किए गए हैं, और तुलनात्मक समय की खपत के तहत मॉडल सटीकता में 6% का सुधार हुआ है; - - [की इंफॉर्मेशन एक्स्ट्रेक्शन](../../ppstructure/kie) ऑप्टिमाइजेशन : एक बिजुवल-स्वतंत्र मॉडल संरचना डिजाइन की गई है, सिमेंटिक एन्टाइटी रिकग्निशन की सटीकता में 2.8% की वृद्धि हुई है, और रिलेशन एक्सट्रैक्शन की सटीकता में 9.1% की वृद्धि हुई है। + - रिलीज [PP-Structurev2](../../ppstructure),फंक्शन और परफॉरमेंस के साथ पूरी तरह से उन्नत, चायनीज शीन्स के अनुकूल, और मदद के लिए [लेआउट रिकवरी](../../ppstructure/recovery) और **पीडीएफ को वर्ड में बदलने के लिए वन लाइन कमांड**; + - [लेआउट एनालाइस](../../ppstructure/layout) ऑप्टिमाइजेशन: मॉडल स्टोरेज में 95% की कमी, जबकि स्पीड में 11 गुना वृद्धि , और एवरेज CPU स टाइम-कॉस्ट केवल 41ms है; + - [टेबल रिकोगनाइजेशन](../../ppstructure/table) ऑप्टिमाइजेशन: 3 ऑप्टिमाइज़ेशन के तरीके डिजाइन किए गए हैं, और तुलनात्मक समय की खपत के तहत मॉडल सटीकता में 6% का सुधार हुआ है; + - [की इंफॉर्मेशन एक्स्ट्रेक्शन](../../ppstructure/kie) ऑप्टिमाइजेशन : एक बिजुवल-स्वतंत्र मॉडल संरचना डिजाइन की गई है, सिमेंटिक एन्टाइटी रिकग्निशन की सटीकता में 2.8% की वृद्धि हुई है, और रिलेशन एक्सट्रैक्शन की सटीकता में 9.1% की वृद्धि हुई है। - **🔥2022.7 रिलीज [ओसीआर दृश्य आवेदन संग्रह](../../applications/README_en.md)** - - रिलीज **9 वर्टिकल मॉडल** जैसे कि डिजिटल ट्यूब, एलसीडी स्क्रीन, लाइसेंस प्लेट, हस्तलेखन पहचान मॉडल, उच्च-सटीक एसवीटीआर मॉडल, आदि, जो सामान्य रूप से मुख्य ओसीआर वर्टिकल अनुप्रयोगों, विनिर्माण, वित्त और परिवहन उद्योगों को कवर करते हैं। + - रिलीज **9 वर्टिकल मॉडल** जैसे कि डिजिटल ट्यूब, एलसीडी स्क्रीन, लाइसेंस प्लेट, हस्तलेखन पहचान मॉडल, उच्च-सटीक एसवीटीआर मॉडल, आदि, जो सामान्य रूप से मुख्य ओसीआर वर्टिकल अनुप्रयोगों, विनिर्माण, वित्त और परिवहन उद्योगों को कवर करते हैं। - **🔥2022.5.9 रिलीज Paddleओसीआर [रिलीज/2.5](https://github.com/PaddlePaddle/Paddleओसीआर/tree/release/2.5)** - रिलीज [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3): तुलनात्मक स्पीड के साथ, चाइनीज शीन्स का प्रभाव PP-ओसीआर v2 की तुलना में 5% की और वृद्धि हुयी है इंगलिस शीन्स के प्रभाव में 11% का सुधार हुआ है, और 80 भाषाओं के बहुभाषी मॉडलों की औसत पहचान सटीकता में 5% से अधिक सुधार हुआ है। @@ -48,7 +45,6 @@ - [और अधिक](../doc_en/update_en.md) - ## 🌟 विशेषताएँ Paddleओसीआर से संबंधित विभिन्न प्रकार के अत्याधुनिक एल्गोरिथ्म को सपोर्ट करता है, और विकसित औद्योगिक विशेष रुप से प्रदर्शित मॉडल/समाधान [PP- OCR](../doc_en/ppocr_introduction_en.md) और [PP-Structure](../../ppstructure/README.md) इस आधार पर और डेटा प्रोडक्शन की पूरी प्रोसेस के माध्यम से प्राप्त करें, मॉडल ट्रेनिंग, दबाव, अनुमान और तैनाती। @@ -70,13 +66,14 @@ paddleocr --image_dir /your/test/image.jpg --lang=hi ## 📚 ई-बुक: *ओसीआर में गोता लगाएँ* + - [ओसीआर में गोता लगाएँ](../doc_en/ocr_book_en.md) ## 👫 समुदाय -अंतरराष्ट्रीय डेवलपर्स के लिए, हम सम्मान करते हैं [पैडलओसीआर चर्चाएँ] (https://github.com/PaddlePaddle/PaddleOCR/discussions) हमारे अंतरराष्ट्रीय कम्युनिटी मंच के रूप में। यहां सभी विचारों और प्रश्नों पर अंग्रेजी में चर्चा की जा सकती है। +अंतरराष्ट्रीय डेवलपर्स के लिए, हम सम्मान करते हैं [पैडलओसीआर चर्चाएँ] () हमारे अंतरराष्ट्रीय कम्युनिटी मंच के रूप में। यहां सभी विचारों और प्रश्नों पर अंग्रेजी में चर्चा की जा सकती है। @@ -88,7 +85,6 @@ paddleocr --image_dir /your/test/image.jpg --lang=hi | इंग्लिश अल्ट्रा- लाइट वेट PP-ओसीआरv3 मॉडल (13.4M) | en_PP-ओसीआरv3_xx | मोबाइल और सर्वर | [इन्फरन्स मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [प्रशिक्षितमॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar)| [इन्फरन्समॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) | | चाइनीस और इंग्लिश अल्ट्रा- लाइट वेट PP-ओसीआरv3 मॉडल(16.2M) | ch_PP-ओसीआरv3_xx | मोबाइल और सर्वर | [इन्फरन्स मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) | - - अधिक मॉडल डाउनलोड (एकाधिक भाषाओं सहित) के लिए, कृपया [PP-ओसीआर सीरीज मॉडल डाउनलोड](../doc_en/models_list_en.md) देखें। - एक नए भाषा अनुरोध के लिए, कृपया [नई भाषा अनुरोधों के लिए दिशानिर्देश](#language_requests). - स्ट्रक्चर मॉडल डोकोमेंट एनालाइज के लिए, कृपया देखें [PP-Structure models](../../ppstructure/docs/models_list_en.md). @@ -225,4 +221,5 @@ paddleocr --image_dir /your/test/image.jpg --lang=hi ## 📄 लाइसेंस + इस प्रोजेक्ट को इन परियोजना के तहत जारी किया गया है Apache 2.0 license diff --git a/doc/doc_i18n/README_日本語.md b/docs/index.jp.md similarity index 88% rename from doc/doc_i18n/README_日本語.md rename to docs/index.jp.md index 9a1f97736e..d32871ac7b 100644 --- a/doc/doc_i18n/README_日本語.md +++ b/docs/index.jp.md @@ -13,7 +13,6 @@

- ## 紹介 PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な OCR ツールを作成することを目的とし、ユーザーがより優れたモデルをトレーニングし、実践的に対応できるようになるために役立つAIOCRです。 @@ -25,30 +24,28 @@ PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な - -
## 📣 最新アップデート -- **🔥2022.8.24 リリース PaddleOCR [release/2.6 ](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** - - [PP-Structurev2](../../ppstructure/)がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、 [レイアウトの復旧](../../ppstructure/recovery) さらに**1 行のコマンドをPDFへ転換、そして Word**に変換可能。 - - [レイアウト分析](../../ppstructure/layout) の最適化:モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。 - - [表認識](../../ppstructure/table) 最適化:3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。 - - [キー情報抽出](../../ppstructure/kie) 最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。 + +- **🔥2022.8.24 リリース PaddleOCR [release/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** + - [PP-Structurev2](../../ppstructure/)がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、 [レイアウトの復旧](../../ppstructure/recovery) さらに**1 行のコマンドをPDFへ転換、そして Word**に変換可能。 + - [レイアウト分析](../../ppstructure/layout) の最適化:モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。 + - [表認識](../../ppstructure/table) 最適化:3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。 + - [キー情報抽出](../../ppstructure/kie) 最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。 - **🔥2022.7 リリース [OCR scene application collection](../../applications/README_en.md)** - - デジタルチューブ、液晶画面、ナンバー プレート、手書き認識モデル、高精度 SVTR モデルなど、**9つの垂直モデル**をリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。 + - デジタルチューブ、液晶画面、ナンバー プレート、手書き認識モデル、高精度 SVTR モデルなど、**9つの垂直モデル**をリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。 - **🔥2022.5.9 リリース PaddleOCR [release/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)** - - [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3)リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。 - - [PPOCRLabelv2](https://github.com/PFCCLab/PPOCRLabel)リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。 + - [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3)リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。 + - [PPOCRLabelv2](https://github.com/PFCCLab/PPOCRLabel)リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。 - インタラクティブな電子書籍 [*"OCR に没入"*](../doc_en/ocr_book_en.md)、 をリリース。 OCRフルスタック技術の最先端の理論とコードの実践をカバー。 - [もっと](../doc_en/update_en.md) - ## 🌟 PaddleOCRとは? PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション [PP-OCR](../doc_en/ppocr_introduction_en.md) や [PP-Structure](../../ppstructure/README.md) を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。 @@ -70,6 +67,7 @@ paddleocr --image_dir /your/test/image.jpg --lang=japan # change for i18n abbr ## 📚 電子書籍:*OCRに入る* + - [OCRに没入](../doc_en/ocr_book_en.md) @@ -88,7 +86,6 @@ paddleocr --image_dir /your/test/image.jpg --lang=japan # change for i18n abbr | 英語超軽量PP-OCRv3モデル(13.4M) | en_PP-OCRv3_xx | モバイル & サーバー | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) | | 中国語と英語の超軽量 PP-OCRv3 モデル(16.2M) | ch_PP-OCRv3_xx | モバイル & サーバー | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) | - - その他のモデルのダウンロード (多言語を含む) については、[PP-OCR シリーズ モデルのダウンロード] (../doc_en/models_list_en.md)をご参照ください。 - 新しい言語のリクエストについては、 [新しい言語_リクエストのガイドライン](#language_requests)を参照してください。 - 構造文書分析モデルについては、[PP-Structure models](../../ppstructure/docs/models_list_en.md)をご参照ください。 @@ -224,4 +221,5 @@ paddleocr --image_dir /your/test/image.jpg --lang=japan # change for i18n abbr ## 📄 ライセンス + このプロジェクトは以下の場所でリリースされています Apache 2.0 license diff --git a/doc/doc_i18n/README_한국어.md b/docs/index.korean.md similarity index 92% rename from doc/doc_i18n/README_한국어.md rename to docs/index.korean.md index e9af69f5d7..9699e0dbf4 100644 --- a/doc/doc_i18n/README_한국어.md +++ b/docs/index.korean.md @@ -1,5 +1,3 @@ -[English](../../README_en.md) | [简体中文](../../README.md) | [हिन्दी](./README_हिन्द.md) | [日本語](./README_日本語.md) | 한국인 | [Pу́сский язы́к](./README_Ру́сский_язы́к.md) -

@@ -23,18 +21,17 @@ PaddleOCR은 사용자들이 보다 나은 모델을 훈련하여 실전에 투 -

- ## 📣최근 업데이트 + - **🔥2022년 8월 24일에 패들 OCR 출시 [출시/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** 차이니즈 씬에 맞춘 완전 업그레이드 된 기능과 성능을 갖춘 ; [PP-Structurev2](../../ppstructure/) 출시, 그리고 레이아웃 리커버리 ](../../ppstructure/recovery) 신규 지원 및 PDF 를 워드로 전환하는 원 라인 명령 - - [레이아웃 분석](../../ppstructure/layout) 최적화: 95% 감소된 모델 저장, while 반면 속도는 11배 증가하고, 평균 CPU 시간 비용은 41ms에 불과함; - - [표 인식](../../ppstructure/table) 최적화: 3 최적화 전략이 디자인되고 모델 정확도는 비교 가능한 시간 소비 하에 6% 개선됨; - - [핵심 정보 추출](../../ppstructure/kie) 최적화: 시각에 의존하지 않는 모델 구조가 디자인되고, 의미체 인식 정확도가 2.8% 증가되며 관계 추출 정확도는 9.1% 증가됨. + - [레이아웃 분석](../../ppstructure/layout) 최적화: 95% 감소된 모델 저장, while 반면 속도는 11배 증가하고, 평균 CPU 시간 비용은 41ms에 불과함; + - [표 인식](../../ppstructure/table) 최적화: 3 최적화 전략이 디자인되고 모델 정확도는 비교 가능한 시간 소비 하에 6% 개선됨; + - [핵심 정보 추출](../../ppstructure/kie) 최적화: 시각에 의존하지 않는 모델 구조가 디자인되고, 의미체 인식 정확도가 2.8% 증가되며 관계 추출 정확도는 9.1% 증가됨. - **🔥2022년 7월 출시[OCR 씬 애플리케이션 컬렉션](../../applications/README_en.md)** 디지털 튜브, LCD 스크린, 라이선스 플레이트, 수기 인식 모델, 고정밀 SVTR 모델 등등과 같은 “9수직 모델” 출시로, 일반적으로 주된 OCR 수직 애플리케이션, 제조, 금융 및 수송 산업 커버 @@ -42,19 +39,18 @@ PaddleOCR은 사용자들이 보다 나은 모델을 훈련하여 실전에 투 - **🔥2022년 5월 9일에 패들 OCR 출시 [출시/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)** - [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3)출시: 5%.비교 가능한 속도로, 차이니즈 씬의 효과는 PP-OCRv2와 비교해 볼 때 추가로 5% 정도 더 개선되고, 잉글리쉬 씬 효과는 11% 개선되었으며, 80개 언어 다중 언어 모델 평균 인식 정확도는 5% 이상 개선됨. - [PPOCRLabelv2](https://github.com/PFCCLab/PPOCRLabel)출시: 표 인식 업무, 핵심 정보 추출 업무 및 불규칙한 텍스트 이미지주석 기능 추가. - - 쌍방향e-북 출시 [*"OCR 뛰어들기"*](../doc_en/ocr_book_en.md), 첨단 이론 및 OCR 정식 스택 기술 코드 연습 포함. + - 쌍방향e-북 출시 [*"OCR 뛰어들기"*](../doc_en/ocr_book_en.md), 첨단 이론 및 OCR 정식 스택 기술 코드 연습 포함. - [추가](../doc_en/update_en.md) - ## 🌟특징 + 패들OCR은 OCR 관련 다양한 첨단 알고리즘 지원 [PP-OCR](../doc_en/ppocr_introduction_en.md) 및 [PP-Structure](../../ppstructure/README.md) 이를 기반으로, 그리고 전체 데이터 생산 처리, 모델 훈련, 압축, 추론 및 배치를 통해 획득.
- ## ⚡ 신속한 경험 ```bash @@ -68,6 +64,7 @@ paddleocr --image_dir /your/test/image.jpg --lang=korean ## 📚 E-북: *OCR로 뛰어들기* + - [OCR로 뛰어들기](../doc_en/ocr_book_en.md) @@ -86,7 +83,6 @@ paddleocr --image_dir /your/test/image.jpg --lang=korean | 영어 초경량 PP-OCRv3 모델(13.4M) | en_PP-OCRv3_xx | 모바일 & 서버 | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) | | 중국어 및 영어 초경량 PP-OCRv3 model(16.2M) | ch_PP-OCRv3_xx | 모바일 & 서버 | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) | - - (다중 언어를 포함하여)더 많은 모델을 다운로드 하려면, [PP-OCR 시리즈 모델 다운로드](../doc_en/models_list_en.md)를 참조할 것. - 신규 언어 요청에 대해서는, [신규 언어 요청 지침](#language_requests)을 참조할 것. - 구조적 문서 분석 모델에 대해서는, [PP-Structure models](../../ppstructure/docs/models_list_en.md).을 참조할 것. @@ -133,12 +129,12 @@ paddleocr --image_dir /your/test/image.jpg --lang=korean - [표 인식](../doc_en/algorithm_overview_en.md) - [핵심 정보 추출](../doc_en/algorithm_overview_en.md) - [PaddleOCR에 신규 알고리즘 추가](../doc_en/add_new_algorithm_en.md) -- 데이터 주석 및 합성 +- 데이터 주석 및 합성 - [반-자동 주석 툴: PPOCRLabel](https://github.com/PFCCLab/PPOCRLabel/blob/main/README.md) - [데이터 합성 툴: 스타일-텍스트](https://github.com/PFCCLab/StyleText/blob/main/README.md) - [기타 데이터 주석 툴](../doc_en/data_annotation_en.md) - [기타 데이터 합성 툴](../doc_en/data_synthesis_en.md) -- 데이터세트 +- 데이터세트 - [일반 OCR 데이터세트(중국어/영어)](../doc_en/dataset/datasets_en.md) - [수기_OCR_데이터세트(중국어)](../doc_en/dataset/handwritten_datasets_en.md) - [다양한 OCR 데이터세트(다중언어)](../doc_en/dataset/vertical_and_multilingual_datasets_en.md) @@ -173,7 +169,6 @@ paddleocr --image_dir /your/test/image.jpg --lang=korean -
PP-OCRv3 영어 모델
@@ -190,7 +185,6 @@ paddleocr --image_dir /your/test/image.jpg --lang=korean
-
PP-Structurev2 1. 레이아웃 분석 + 표 인식 @@ -221,4 +215,5 @@ paddleocr --image_dir /your/test/image.jpg --lang=korean ## 📄 라이선스 + 본 프로젝트는 Apache 2.0 license 하에 출시됨. diff --git a/doc/doc_i18n/README_Ру́сский_язы́к.md b/docs/index.ru.md similarity index 83% rename from doc/doc_i18n/README_Ру́сский_язы́к.md rename to docs/index.ru.md index 5193895902..cce89b7499 100644 --- a/doc/doc_i18n/README_Ру́сский_язы́к.md +++ b/docs/index.ru.md @@ -13,7 +13,6 @@

- ## Введение PaddleOCR стремится создавать многоязычные, потрясающие, передовые и практичные инструменты OCR, которые помогают пользователям обучать лучшие модели и применять их на практике @@ -25,30 +24,26 @@ PaddleOCR стремится создавать многоязычные, пот - -
- - ## 📣 Последние обновления + - **🔥2022.8.24 Выпуск PaddleOCR [Выпуск /2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** - - Выпускать [PP-Structurev2](./ppstructure/),с полностью обновленными функциями и производительностью, адаптированными для китайских сцен и новой поддержкой pаспознавание таблиц + - Выпускать [PP-Structurev2](./ppstructure/),с полностью обновленными функциями и производительностью, адаптированными для китайских сцен и новой поддержкой pаспознавание таблиц [Восстановление макета](./ppstructure/recovery) и **однострочная команда для преобразования PDF в Word**; - - [Анализ макета](./ppstructure/layout) оптимизация: память модели уменьшена на 95%, а скорость увеличена в 11 раз, а среднее время процессорного времени составляет всего 41 мс; - - [Распознавание таблиц](./ppstructure/table) оптимизация: разработано 3 стратегии оптимизации, а точность модели улучшена на 6% при сопоставимых затратах времени; - - [Извлечение ключевой информации](./ppstructure/kie) оптимизация: разработана визуально независимая структура модели, точность распознавания семантической сущности увеличена на 2,8%, а точность извлечения отношения увеличена на 9,1%. + - [Анализ макета](./ppstructure/layout) оптимизация: память модели уменьшена на 95%, а скорость увеличена в 11 раз, а среднее время процессорного времени составляет всего 41 мс; + - [Распознавание таблиц](./ppstructure/table) оптимизация: разработано 3 стратегии оптимизации, а точность модели улучшена на 6% при сопоставимых затратах времени; + - [Извлечение ключевой информации](./ppstructure/kie) оптимизация: разработана визуально независимая структура модели, точность распознавания семантической сущности увеличена на 2,8%, а точность извлечения отношения увеличена на 9,1%. - **🔥2022.7 Выпуск [Коллекция приложений сцены OCR](../../applications/README_en.md)** - Выпуск **9 вертикальных моделей**, таких как цифровая трубка, ЖК-экран, номерной знак, модель распознавания рукописного ввода, высокоточная модель SVTR и т. д., охватывающих основные вертикальные приложения OCR в целом, производственной, финансовой и транспортной отраслях. - **🔥2022.5.9 Выпуск PaddleOCR [Выпуск /2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)** - Выпускать [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3): При сопоставимой скорости эффект китайской сцены улучшен на 5% по сравнению с ПП-OCRRv2, эффект английской сцены улучшен на 11%, а средняя точность распознавания 80 языковых многоязычных моделей улучшена более чем на 5%. - - Выпускать [PPOCRLabelv2](https://github.com/PFCCLab/PPOCRLabel/blob/main/README.md): Добавьте функцию аннотации для задачи распознавания таблиц, задачи извлечения ключевой информации и изображения неправильного текста. - - Выпустить интерактивную электронную книгу [*"Погружение в OCR"*](../doc_en/ocr_book_en.md), охватывает передовую теорию и практику кодирования технологии полного стека OCR. +- Выпускать [PPOCRLabelv2](https://github.com/PFCCLab/PPOCRLabel/blob/main/README.md): Добавьте функцию аннотации для задачи распознавания таблиц, задачи извлечения ключевой информации и изображения неправильного текста. + - Выпустить интерактивную электронную книгу [*"Погружение в OCR"*](../doc_en/ocr_book_en.md), охватывает передовую теорию и практику кодирования технологии полного стека OCR. - [подробнее](../doc_en/update_en.md) - ## 🌟 Функции PaddleOCR поддерживает множество передовых алгоритмов, связанных с распознаванием текста, и разработала промышленные модели/решения. [PP-OCR](../doc_en/ppocr_introduction_en.md) и [PP-Structure](./ppstructure/README.md) на этой основе и пройти весь процесс производства данных, обучения модели, сжатия, логического вывода и развертывания. @@ -57,9 +52,6 @@ PaddleOCR поддерживает множество передовых алг - - - ## ⚡ Быстрый опыт ```bash @@ -73,6 +65,7 @@ paddleocr --image_dir /your/test/image.jpg --lang=ru ## 📚 Электронная книга: *Погружение в OCR* + - [Погружение в распознавание символов](../doc_en/ocr_book_en.md) @@ -106,14 +99,14 @@ paddleocr --image_dir /your/test/image.jpg --lang=ru - [Модель Zoo](../doc_en/модельs_en.md) - [Модель тренировки](../doc_en/training_en.md) - [Обнаружение текста](../doc_en/detection_en.md) - - [Распознавание текста](../doc_en/recognition_en.md) - - [Классификация направления текста](../doc_en/angle_class_en.md) + - [Распознавание текста](../doc_en/recognition_en.md) + - [Классификация направления текста](../doc_en/angle_class_en.md) - Модель Сжатие - [Модель квантования](./deploy/slim/quantization/README_en.md) - [Модель Обрезка](./deploy/slim/prune/README_en.md) - [Дистилляция знаний](../doc_en/knowledge_distillation_en.md) - [Вывод и развертывание](./deploy/README.md) - - [Python Вывод](../doc_en/ inference _ppocr_en.md) + - [Python Вывод](../doc_en/ inference_ppocr_en.md) - [Вывод C++](./deploy/cpp_infer/readme.md) -[Подача](./deploy/pdserving/README.md) - [Мобильный](./deploy/lite/readme.md) @@ -121,10 +114,10 @@ paddleocr --image_dir /your/test/image.jpg --lang=ru -[ВеслоОблако](./deploy/paddlecloud/README.md) - [Benchmark](../doc_en/benchmark_en.md) - [PP-Structure 🔥](../../ppstructure/README.md) - - [Быстрый старт](../../ppstructure/docs/quickstart_en.md) - - [Модель Zoo](../../ppstructure/docs/models_list_en.md) - - [Модель тренировки](../doc_en/training_en.md) - - [Анализ макета](../../ppstructure/layout/README.md) + - [Быстрый старт](../../ppstructure/docs/quickstart_en.md) + - [Модель Zoo](../../ppstructure/docs/models_list_en.md) + - [Модель тренировки](../doc_en/training_en.md) + - [Анализ макета](../../ppstructure/layout/README.md) - [Распознавание таблиц](../../ppstructure/table/README.md) - [Извлечение ключевой информации](../../ppstructure/kie/README.md) - [Вывод и развертывание](./deploy/README.md) @@ -139,13 +132,13 @@ paddleocr --image_dir /your/test/image.jpg --lang=ru - [Извлечение ключевой информации](../doc_en/algorithm_overview_en.md) - [Добавьте новые алгоритмы в PaddleOCR](../doc_en/add_new_algorithm_en.md) - Аннотации и синтез данных - - [Полуавтоматический инструмент аннотации данных: метка ППOCRR](https://github.com/PFCCLab/PPOCRLabel/blob/main/README.md) - - [Инструмент синтеза данных: Стиль-текст](https://github.com/PFCCLab/StyleText/blob/main/README.md) - - [Другие инструменты аннотирования данных](../doc_en/data_annotation_en.md) - - [Другие инструменты синтеза данных](../doc_en/data_synthesis_en.md) + - [Полуавтоматический инструмент аннотации данных: метка ППOCRR](https://github.com/PFCCLab/PPOCRLabel/blob/main/README.md) + - [Инструмент синтеза данных: Стиль-текст](https://github.com/PFCCLab/StyleText/blob/main/README.md) + - [Другие инструменты аннотирования данных](../doc_en/data_annotation_en.md) + - [Другие инструменты синтеза данных](../doc_en/data_synthesis_en.md) - Наборы данных - [Общие наборы данных OCR (китайский/английский)](../doc_en/dataset/datasets_en.md) - - [Наборы данных Рукописный/_OCR_ наборы данных (китайский)](../doc_en/dataset/handwritten_datasets_en.md) + - [Наборы данных Рукописный/*OCR* наборы данных (китайский)](../doc_en/dataset/handwritten_datasets_en.md) - [Различные наборы данных OCR (многоязычные)](../doc_en/dataset/vertical_and_multilingual_datasets_en.md) - [Анализ макета](../doc_en/dataset/layout_datasets_en.md) - [Распознавание таблиц](../doc_en/dataset/table_datasets_en.md) @@ -227,4 +220,5 @@ paddleocr --image_dir /your/test/image.jpg --lang=ru ## 📄 Лицензия + Этот проект выпущен под Apache 2.0 license diff --git a/mkdocs.yml b/mkdocs.yml index 4ebd8942b9..c843400e2c 100644 --- a/mkdocs.yml +++ b/mkdocs.yml @@ -191,6 +191,22 @@ plugins: 社区: Community 社区贡献: Community Contribution 附录: Appendix + - locale: jp + name: 日本語 + site_name: PaddleOCR ドキュメント + link: /jp/ + - locale: ru + name: 俄语 + site_name: Документация PaddleOCR + link: /ru/ + - locale: hindi + name: 印地语 + site_name: पैडलओसीआर दस्तावेज़ीकरण + link: /hindi/ + - locale: korean + name: 韩语 + site_name: PaddleOCR 문서 + link: /korean/ - locale: "null" name: Help translating build: false diff --git a/ppstructure/README.md b/ppstructure/README.md index 6e3e6bbf1d..d699a79c32 100644 --- a/ppstructure/README.md +++ b/ppstructure/README.md @@ -1 +1,3 @@ See [Docs](https://paddlepaddle.github.io/PaddleOCR/latest/en/ppstructure/overview.html) for details. + +请移步[Docs](https://paddlepaddle.github.io/PaddleOCR/latest/ppstructure/overview.html)查看。 diff --git a/ppstructure/README_ch.md b/ppstructure/README_ch.md deleted file mode 100644 index b9878c8cfe..0000000000 --- a/ppstructure/README_ch.md +++ /dev/null @@ -1 +0,0 @@ -请移步[Docs](https://paddlepaddle.github.io/PaddleOCR/latest/ppstructure/overview.html)查看。