Mengapa Aspose.OCR untuk Python melalui Java?

Aspose.OCR untuk Python melalui Java dengan mulus mengintegrasikan kemampuan pengenalan karakter optik (OCR) yang kuat ke dalam notebook dan aplikasi Python lintas platform Anda. Dengan API kami yang intuitif dan berkecepatan tinggi, Anda dapat dengan mudah mengekstrak teks dari pindaian, tangkapan layar, tautan web, atau foto ponsel cerdas, memberikan hasil yang siap untuk konsolidasi, analisis, atau penyimpanan. Kenali gambar pindaian, foto ponsel cerdas, tangkapan layar, dan PDF pindaian, simpan hasilnya dalam format dokumen populer. Filter pra-pemrosesan tingkat lanjut menangani gambar yang diputar, miring, dan berisik. Optimalkan kinerja dengan memindahkan tugas ke GPU.

Illustration ocr

OCR yang Cepat dan Akurat

Raih hasil OCR berkecepatan tinggi dan akurat dengan Python canggih kami melalui teknologi Java.

Dukungan Multibahasa

Kenali teks dalam 130+ bahasa, termasuk skrip Latin, Sirilik, Arab, Persia, India, dan Tiongkok, memastikan keserbagunaan untuk aplikasi Python Anda melalui Java.

Dukungan Gambar Fleksibel

Proses gambar dari pemindai, kamera, dan ponsel cerdas secara lancar dengan Python melalui Java.

Presisi dalam Pengenalan Karakter Cina

Kenali lebih dari 6.000 karakter Cina dengan presisi dalam proyek Python Anda melalui Java.

Pertahankan Gaya dan Pemformatan Font

Pertahankan gaya dan pemformatan font untuk representasi akurat teks yang dikenali dalam aplikasi Python Anda melalui Java.

Contoh kode langsung

Mulai pengenalan teks dari gambar hanya dalam tiga baris kode. Rasakan kesederhanaannya!

Siap mengenali Siap mengenali Letakkan file di sini atau klik untuk menelusuri *

* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Ketentuan penggunaan Dan Kebijakan Privasi.

Hasil pengakuan
 

Ubah gambar menjadi teks

Lebih banyak contoh >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Pilih preferensi Anda

Pilih perpustakaan yang tepat untuk kebutuhan Anda. Jelajahi API yang tersedia dan kemampuannya untuk memilih solusi yang paling efisien.

Keserbagunaan

Python via .NET

Pengembangan, keterbacaan, dan pemeliharaan kode yang mudah
Menawarkan fitur terbanyak dan menerima pembaruan paling sering
Kecepatan keseluruhannya mungkin sedikit lebih lambat dibandingkan platform lain

Keseragaman

Python via Java

Gunakan perpustakaan yang sama di platform apa pun
Jalankan aplikasi Anda dengan lancar di perangkat apa pun
Membutuhkan Java Runtime Environment (JRE) versi 8 atau lebih baru

Pertunjukan

Python via C++

Kecepatan tercepat apa pun platformnya
Banyak kendali atas pengelolaan sumber daya
Ditargetkan untuk pengembang berpengalaman

Kompatibilitas Backend Java

Dirancang sebagai modul Python, perpustakaan kami memastikan kompatibilitas di seluruh sistem operasi utama yang mendukung Java - termasuk Microsoft Windows, Linux, dan macOS, atau platform awan. Hal ini memungkinkan Anda mengembangkan aplikasi di satu platform dan menjalankannya dengan lancar di platform lain, sehingga menghilangkan kebutuhan akan modifikasi kode apa pun.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Format file yang didukung

Aspose.OCR for Python via Java dapat bekerja dengan [file]apa pun( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) Anda bisa mendapatkannya dari pemindai atau kamera. Hasil pengenalan dapat disimpan, diimpor ke database, atau dianalisis secara real time.

Gambar

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Kumpulan OCR

  • Multi-page PDF
  • ZIP
  • Folder

Hasil pengakuan

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalasi Mudah untuk Python melalui Java

Aspose.OCR untuk Python melalui Java dikirimkan sebagai paket Python atau sebagai file yang dapat diunduh dengan ketergantungan minimal. Instal dengan mudah ke dalam proyek Anda, dan Anda siap mengenali teks dalam berbagai bahasa yang didukung dan menyimpan hasil pengenalan dalam berbagai format.

Minta lisensi uji coba untuk memulai pengembangan aplikasi OCR yang berfungsi penuh tanpa batasan.

OCR yang kuat untuk Aplikasi Python

Perpustakaan kami terintegrasi dengan mudah, memungkinkan aplikasi Python berjalan mulus di platform apa pun – desktop Windows, Windows Server, macOS, Linux, dan cloud.

130+ Bahasa Pengenalan

API OCR Python dan Java kami mengenali banyak bahasa dan skrip penulisan populer, termasuk bahasa campuran:

Serahkan deteksi bahasa ke perpustakaan atau tentukan sendiri bahasanya untuk meningkatkan performa dan keandalan pengenalan.

  • Alfabet Latin yang Diperluas: Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
  • Alfabet Sirilik: Rusia, Ukraina, Kazakh, Serbia, Belarusia, Bulgaria;
  • Arab, Persia, Urdu;
  • Aksara Cina dan Dewanagari, termasuk Hindi, Marathi, Bhojpuri, dan lain-lain.

Filter Pemrosesan Gambar yang Ditingkatkan

Ketepatan pengenalan karakter optik sangat bergantung pada kualitas gambar aslinya. Aspose.OCR untuk Python melalui Java menawarkan beragam filter pemrosesan gambar otomatis dan manual untuk mengoptimalkan gambar sebelum dikirimkan ke mesin OCR:

  • Secara otomatis meluruskan gambar yang sedikit miring.
  • Perbaiki rotasi gambar yang sangat miring secara manual.
  • Secara otomatis menghilangkan kotoran, noda, goresan, silau, gradien yang tidak diinginkan, dan jenis kebisingan lainnya.
  • Menyesuaikan kontras gambar secara otomatis.
  • Secara otomatis meningkatkan atau mengubah ukuran gambar secara manual.
  • Ubah gambar menjadi hitam putih atau skala abu-abu.
  • Membalikkan warna gambar, membuat area terang tampak gelap dan area gelap tampak terang.
  • Meningkatkan ketebalan karakter dalam gambar.
  • Memburamkan gambar yang berisik sambil mempertahankan tepi huruf.
  • Luruskan kemiringan halaman dan perbaiki distorsi lensa kamera pada halaman foto.

API khusus untuk berbagai jenis dokumen

Aspose.OCR untuk Python melalui Java menawarkan jaringan saraf yang dilatih khusus untuk mengekstrak teks dari jenis gambar tertentu dengan akurasi maksimum:

  • Kartu identitas dan paspor yang dipindai atau difoto.
  • Pelat nomor kendaraan.
  • Faktur.
  • Tanda terima.

Pemeriksa ejaan bawaan

Meskipun Aspose.OCR untuk Python melalui Java memberikan akurasi pengenalan yang tinggi, cacat pencetakan, kotoran, atau font non-standar dapat menyebabkan karakter atau kata tertentu salah dikenali. Untuk lebih meningkatkan hasil pengenalan, Anda dapat mengaktifkan pemeriksa ejaan, yang menemukan dan secara otomatis memperbaiki kesalahan ejaan berdasarkan bahasa pengenalan yang dipilih.

Jika teks yang dikenali berisi terminologi khusus, singkatan, dan kata lain yang tidak ada dalam kamus ejaan umum, Anda dapat memberikan daftar kata Anda sendiri.

Pengenalan Batch yang Efisien

API Python OCR kami memberdayakan Anda untuk menyederhanakan pengenalan gambar. Manfaatkan metode pemrosesan batch serbaguna untuk pemrosesan banyak gambar secara efisien dalam satu panggilan:

  • Kenali file PDF multi-halaman, TIFF.
  • Memproses semua file dalam satu folder.
  • Menangani pengenalan untuk semua file dalam arsip.
  • Kenali gambar dari daftar tertentu.

Belajar melalui Contoh Python

Jelajahi berbagai contoh Python yang dirancang untuk membantu Anda memahami dengan cepat fungsi dan kemampuan solusi OCR kami. Dapatkan wawasan dengan cepat dalam menciptakan solusi khusus yang memenuhi kebutuhan spesifik bisnis Anda.

Fitur dan Kemampuan

Aspose.OCR for Python via Java Jelajahi fitur lanjutan Aspose.OCR untuk Python

Feature icon

Foto OCR

Ekstrak teks dari foto ponsel cerdas dengan akurasi tingkat pemindaian.

Feature icon

PDF yang dapat dicari

Ubah pindaian apa pun menjadi dokumen yang sepenuhnya dapat dicari dan diindeks.

Feature icon

Pengenalan URL

Kenali gambar dari URL tanpa mengunduhnya secara lokal.

Feature icon

Pengakuan massal

Baca semua gambar dari dokumen multi-halaman, folder, dan arsip.

Feature icon

Font dan gaya apa pun

Identifikasi dan kenali teks dalam semua tipografi dan gaya populer.

Feature icon

Sempurnakan pengenalan

Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.

Feature icon

Pemeriksa ejaan

Tingkatkan hasil dengan mengoreksi kata yang salah eja secara otomatis.

Feature icon

Temukan teks dalam gambar

Telusuri teks atau ekspresi reguler dalam kumpulan gambar.

Feature icon

Bandingkan teks gambar

Bandingkan teks pada dua gambar, apa pun kasus dan tata letaknya.

Contoh Kode Python

Temukan contoh kode untuk mengintegrasikan Aspose.OCR untuk Python melalui Java ke dalam aplikasi Anda dengan lancar.

Instalasi Mudah

Sebagai paket Python atau file yang dapat diunduh dengan ketergantungan minimal, Aspose.OCR untuk Python melalui Java memastikan distribusi yang mudah. Integrasikan ke dalam proyek Anda langsung dari Python, dan Anda siap memanfaatkan kemampuan OCR yang lengkap, menyimpan hasil pengenalan dalam berbagai format.

Pasca instalasi, segera mulai menggunakan Aspose.OCR untuk Python melalui Java, meskipun dengan keterbatasan tertentu. Lisensi sementara menghapus semua batasan versi uji coba selama 30 hari. Manfaatkan periode ini untuk memulai pengembangan aplikasi OCR yang berfungsi penuh, memungkinkan Anda membuat keputusan yang tepat untuk membeli Aspose.OCR untuk Python melalui Java nanti.

Memuat lisensi

lic = License()
lic.set_license(self.licPath)

Pengenalan Gambar

Tantangan utama dalam aplikasi OCR adalah kelangkaan pemindai bagi pengguna akhir. API kami, terintegrasi secara mulus dengan Python melalui Java, dilengkapi filter pra-pemrosesan gambar bawaan yang kuat yang menangani gambar yang diputar, miring, dan berisik. Dikombinasikan dengan dukungan untuk semua format gambar, memungkinkan pengenalan yang andal, bahkan dari foto ponsel cerdas. Sebagian besar pra-pemrosesan dan koreksi gambar dilakukan secara otomatis, sehingga memerlukan intervensi Anda hanya dalam kasus-kasus sulit.

Terapkan koreksi gambar otomatis - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Konverter Universal Python

API kami dengan mahir membaca gambar apa pun dari pemindai, kamera, atau ponsel cerdas: dokumen PDF, file JPEG, PNG, TIFF, GIF, BMP. Dukungan penuh untuk dokumen PDF multi-halaman, TIFF, dan gambar DjVu memastikan keserbagunaan. Anda juga dapat memberikan gambar dari web melalui URL.

Hasil pengenalan dikembalikan dalam format dokumen dan pertukaran data populer: teks biasa, PDF, Microsoft Word, Microsoft Excel, JSON, dan XML.

Kenali PDF dan Simpan Hasil ke berbagai format keluaran - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Mengoptimalkan Penggunaan Sumber Daya

OCR menawarkan algoritme pengenalan khusus untuk mengekstraksi konten dari gambar dengan teks jarang dan latar belakang berisik/berwarna. Metode ini secara signifikan meningkatkan akurasi OCR dalam kasus bisnis berikut:

  • Membaca teks dari foto jalanan.
  • Segmentasikan dan identifikasi rambu dan papan tanda jalan dalam gambar jalan.
  • Temukan label harga dan tafsirkan teks yang diekstraksi sebagai harga.
  • Temukan dan gabungkan wilayah yang diminati pada label makanan, seperti informasi nutrisi atau daftar bahan.
  • Mengidentifikasi dan menganalisis plat nomor mobil.
  • Ekstrak teks dari menu dan katalog.

Area terbuka OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Mengekstrak teks dari foto jalanan

OCR untuk Python menawarkan algoritma pengenalan khusus yang mengekstrak teks dari pelat nomor kendaraan, termasuk foto gelap dan buram. Teks yang dihasilkan kemudian dapat disimpan secara otomatis ke database atau diverifikasi secara otomatis.

Kenali nomor mobil - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)