Java経由でPython OCR APIで画像をテキストに変換する
Pythonを使用して画像のテキストを認識します
その他のショーケース ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
なぜJava経由でPython用のAspose.ocr?
Java経由のPython用Asopse.ocrは、強力な光学文字認識(OCR)機能をクロスプラットフォームのPythonノートブックとアプリケーションにシームレスに統合します。直感的で高速APIを使用すると、スキャン、スクリーンショット、Webリンク、またはスマートフォンの写真からテキストを簡単に抽出し、統合、分析、またはストレージの準備ができた結果を提供できます。スキャンされた画像、スマートフォンの写真、スクリーンショット、スキャンされたPDFを認識し、人気のあるドキュメント形式で結果を保存します。高度な前処理フィルターは、回転、歪んだ、ノイズの多い画像を処理します。 GPUにタスクをオフロードすることにより、パフォーマンスを最適化します。

迅速で正確なOCR
Javaテクノロジーを介して高度なPythonで高速で正確なOCRの結果を達成します。
多言語サポート
ラテン語、キリル語、アラビア語、ペルシャ語、インド語、中国語のスクリプトを含む140以上の言語でテキストを認識し、Javaを介したPythonアプリケーションの汎用性を確保します。
柔軟な画像サポート
Java経由でPythonを使用して、スキャナー、カメラ、スマートフォンからの画像をシームレスに処理します。
漢字認識の精度
Javaを介してPythonプロジェクトで6,000を超える漢字を認識してください。
フォントスタイルとフォーマットを保持します
Javaを介してPythonアプリケーションで認識されたテキストを正確に表現するために、フォントスタイルとフォーマットを維持します。
ライブコードサンプル
わずか3行のコードで画像からテキスト認識を開始します。シンプルさを体験してください!
*ファイルをアップロードするか、サービスを使用することにより、私たちに同意することにより 利用規約 そして プライバシーポリシー.
画像をテキストに変換します
その他の例 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
あなたの好みを選択してください
ニーズに合った適切なライブラリを選択してください。利用可能なAPIとその機能を調査して、最も効率的なソリューションを選択します。
汎用性
Python via .NET
均一
Python via Java
パフォーマンス
Python via C++
Javaバックエンド互換性
Pythonモジュールとして設計されたライブラリは、[Java](https://docsops.com/ocr/java/system-requirements/)をサポートする主要なオペレーティングシステム全体の互換性を保証します。これにより、あるプラットフォームでアプリケーションを開発し、別のプラットフォームでシームレスに実行し、コード変更の必要性を排除できます。
サポートされているファイル形式
Aspose.OCR for Python via Java [ファイル]で動作することができます( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) スキャナーやカメラから入手できます。認識結果は、保存したり、データベースにインポートしたり、リアルタイムで分析されたりできます。
画像
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
バッチOCR
- Multi-page PDF
- ZIP
- Folder
認識結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Java経由のPythonの簡単なインストール
Java経由のPython用のAsophe.ocrは、Pythonパッケージとして、または[ダウンロード可能なファイル](https://releases.aspose.com/ocr/python-java/)として配信されます。簡単に[インストール](https://docs.aspose.com/ocr/python-java/installation/)プロジェクトに参加すると、複数のサポートされている言語でテキストを認識し、さまざまな形式で認識結果を保存する準備ができています。
[トライアルライセンスを要求](https://purchase.aspose.com/temporary-license)完全に機能的なOCRアプリケーションの開発を制限せずに開始します。
Pythonアプリケーション用の強力なOCR
ライブラリは簡単に統合され、PythonアプリケーションがデスクトップWindows、Windows Server、MacOS、Linux、The Cloudの任意のプラットフォームでシームレスに実行できるようにします。
140以上の認識言語
PythonとJava OCR APIは、多数の言語と混合言語を含む人気のあるライティングスクリプトを認識しています。
ライブラリに言語の検出を残すか、認識のパフォーマンスと信頼性を高めるために言語を自分で定義します。
- 拡張ラテン語アルファベット:英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語など。
- キリル語アルファベット:ロシア語、ウクライナ人、カザフ、セルビア語、ベラルーサン、ブルガリア語。
- アラビア語、ペルシャ語、ウルドゥー語。
- ヒンディー語、マラーティー語、ボジプリなどを含む中国とデヴァナガリの脚本。
強化された画像処理フィルター
光学文字認識の精度は、元の画像の品質に大きく依存しています。 Java経由のPython用のAsopse.ocrは、OCRエンジンに提出する前に画像を最適化するための自動化された画像処理フィルターと手動画像処理フィルターの両方を幅広く提供しています。
- わずかに傾いた画像を自動的にまっすぐにします。
- ひどく歪んだ画像の回転を手動で修正します。
- 汚れ、斑点、傷、まぶしさ、不要な勾配、その他の種類のノイズを自動的に除去します。
- 画像のコントラストを自動的に調整します。
- 画像を自動的にアップスケールまたは手動でサイズ変更します。
- 画像を白黒またはグレースケールに変換します。
- 画像の色を反転させ、明るい領域を暗くし、暗い領域が明るく見えます。
- 画像内の文字の厚さを増やします。
- 文字のエッジを保持している間、騒々しい画像をぼかし。
- ページの写真でページの歪みをまっています。
さまざまなドキュメントタイプのための標本API
Java経由のPython用Asophes.ocrは、特別に訓練されたニューラルネットワークを提供し、特定のタイプの画像から最大精度でテキストを抽出します。
- スキャンまたは写真撮影IDカードとパスポート。
- 車両ナンバープレート。
- 請求書。
- 領収書。
組み込みのスペルチェッカー
Java経由のPython用Asophes.ocrは高い認識精度を提供しますが、印刷欠陥、汚れ、または非標準のフォントは、特定の文字または単語が誤って認識される可能性があります。認識結果をさらに改善するために、選択した認識言語に基づいてスペルエラーを見つけて自動的に修正するスペルチェッカーをオンにすることができます。
認識されたテキストに、特殊な用語、略語、および一般的なスペルディクショナリに存在しないその他の単語が含まれている場合、独自の単語リストを提供できます。
効率的なバッチ認識
私たちのPython OCR APIは、画像認識を合理化することを可能にします。単一の呼び出しで複数の画像を効率的に処理するために、汎用性の高いバッチ処理方法を利用してください。
- マルチページPDF、TIFFファイルを認識します。
- フォルダー内のすべてのファイルを処理します。
- アーカイブ内のすべてのファイルの認識を処理します。
- 指定されたリストから画像を認識します。
Pythonの例を介して学習します
OCRソリューションの機能と機能を迅速に把握できるように設計された、さまざまな[Pythonの例](https://products.aspose.com/ocr/python-java/conversion/)を探索してください。特定のビジネス要件を満たすカスタマイズされたソリューションの作成に関する洞察をすばやく入手してください。
機能と機能
Aspose.OCR for Python via Java Python用のAspose.ocrの高度な機能を調べてください
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
スキャンを完全に検索可能でインデックス可能なドキュメントに変換します。
URL認識
ローカルにダウンロードせずにURLから画像を認識します。
バルク認識
マルチページドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
フォントとスタイル
すべての人気のある書体とスタイルでテキストを特定して認識します。
微調整の認識
最良の認識結果については、すべてのOCRパラメーターを調整します。
スペルチェッカー
間違いのある単語を自動的に修正することにより、結果を改善します。
画像でテキストを見つけます
一連の画像内でテキストまたは正規表現を検索します。
画像テキストを比較します
ケースとレイアウトに関係なく、2つの画像のテキストを比較します。
Pythonコードサンプル
コードサンプルを発見して、Javaを介してPython用のAspose.ocrをアプリケーションにシームレスに統合します。
楽なインストール
Pythonパッケージまたは最小限の依存関係を備えたダウンロード可能なファイルとして、Java経由のPython用Aspose.ocrは簡単な配布を保証します。 Pythonからプロジェクトに直接統合すると、完全なOCR機能を活用し、認識結果をさまざまな形式で保存する準備ができています。一時的なライセンスにより、すべての試用版の制限が30日間削除されます。この期間を利用して、完全に機能するOCRアプリケーションの開発を開始し、後でJava経由でPythonのAspose.ocrを購入することについて情報に基づいた決定を下すことができます。
ロードライセンス
lic = License()
lic.set_license(self.licPath)
画像認識
OCRアプリケーションの主な課題は、エンドユーザーにとってスキャナーが不足していることです。 Javaを介してPythonとシームレスに統合されたAPIは、回転、歪んだ、騒々しい画像の処理処理フィルターを堅牢に組み込んだ画像を備えています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真からでも信頼できる認識が可能になります。ほとんどの前処理と画像補正は自動化されており、困難な場合にのみ介入が必要です。
自動画像補正を適用-Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
APIは、スキャナー、カメラ、またはスマートフォンの画像をあらゆる画像(PDFドキュメント、JPEG、PNG、TIFF、GIF、BMPファイル)から読み取ります。マルチページPDFドキュメント、TIFF、およびDJVU画像の完全なサポートにより、汎用性が保証されます。 URLを介してWebから画像を提供することもできます。
認識結果は、一般的なドキュメントおよびデータ交換形式で返されます:Plain Text、PDF、Microsoft Word、Microsoft Excel、JSON、およびXML。
PDFを認識し、結果をさまざまな出力形式に保存-Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
リソースの使用量を最適化します
OCRは、まばらなテキストとノイズ/色の背景を持つ画像からコンテンツを抽出するための特別な認識アルゴリズムを提供します。この方法は、次のビジネスケースでOCRの精度を大幅に向上させます。
- ストリート写真からテキストを読んでください。
- ストリート画像内の道路標識と看板をセグメント化して特定します。
- 値札を見つけて、抽出されたテキストを価格として解釈します。
- 栄養情報や成分リストなど、食品ラベルで関心のある領域を見つけて集約します。
- 車のライセンスプレートを特定して分析します。
- メニューとカタログからテキストを抽出します。
オープンエリアOCR -Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
ストリート写真からテキストを抽出します
OCR for Pythonは、暗いぼやけた写真を含む車両のナンバープレートからテキストを抽出する特別な認識アルゴリズムを提供します。結果のテキストは、データベースに自動的に保存するか、自動的に検証できます。
車番号を認識 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)