Mengapa Aspose.ocr untuk Python via Java?

Aspose.ocr untuk Python melalui Java dengan mulus mengintegrasikan kemampuan pengenalan karakter optik yang kuat (OCR) ke dalam notebook dan aplikasi python lintas platform Anda. Dengan API intuitif dan berkecepatan tinggi kami, Anda dapat dengan mudah mengekstrak teks dari pemindaian, tangkapan layar, tautan web, atau foto ponsel cerdas, memberikan hasil yang siap untuk konsolidasi, analisis, atau penyimpanan. Kenali gambar yang dipindai, foto ponsel cerdas, tangkapan layar, dan PDF yang dipindai, menyimpan hasil dalam format dokumen populer. Filter pra-pemrosesan canggih menangani gambar yang diputar, miring, dan berisik. Optimalkan kinerja dengan membongkar tugas ke GPU.

Illustration ocr

OCR yang cepat dan akurat

Mencapai hasil OCR berkecepatan tinggi dan akurat dengan python canggih kami melalui teknologi Java.

Dukungan multibahasa

Kenali teks dalam 140+ bahasa, termasuk skrip Latin, Cyrillic, Arab, Persia, Indic, dan Cina, memastikan keserbagunaan untuk aplikasi Python Anda melalui Java.

Dukungan gambar yang fleksibel

Proses gambar dari pemindai, kamera, dan smartphone mulus dengan Python melalui Java.

Ketepatan dalam pengenalan karakter Cina

Kenali lebih dari 6.000 karakter Cina dengan presisi dalam proyek Python Anda melalui Java.

Mempertahankan gaya dan format font

Pertahankan gaya font dan pemformatan untuk representasi yang akurat dari teks yang diakui dalam aplikasi Python Anda melalui Java.

Sampel Kode Langsung

Memulai pengenalan teks dari gambar hanya dalam tiga baris kode. Rasakan kesederhanaan!

Siap untuk dikenali Siap untuk dikenali Jatuhkan file di sini atau klik untuk menelusuri *

* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Ketentuan Penggunaan Dan Kebijakan Privasi.

Hasil pengakuan
 

Konversi gambar ke teks

Lebih banyak contoh >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Pilih preferensi Anda

Pilih perpustakaan yang tepat untuk kebutuhan Anda. Jelajahi API yang tersedia dan kemampuannya untuk memilih solusi yang paling efisien.

Keserbagunaan

Python via .NET

Pengembangan, keterbacaan, dan pemeliharaan kode yang mudah
Menawarkan fitur terbanyak dan menerima pembaruan yang paling sering
Kecepatan keseluruhan mungkin sedikit lebih lambat dari platform lainnya

Keseragaman

Python via Java

Gunakan pustaka yang sama di platform apa pun
Jalankan aplikasi Anda dengan mulus di perangkat apa pun
Membutuhkan Java Runtime Environment (JRE) versi 8 atau lebih baru

Pertunjukan

Python via C++

Kecepatan tercepat terlepas dari platform
Banyak kontrol atas manajemen sumber daya
Ditargetkan untuk pengembang yang berpengalaman

Java Backend Compatibility

Dirancang sebagai modul Python, perpustakaan kami memastikan kompatibilitas di seluruh sistem operasi utama yang mendukung Java - termasuk Microsoft Windows, Linux, dan MacOS, atau platform cloud. Ini memungkinkan Anda untuk mengembangkan aplikasi pada satu platform dan menjalankannya dengan mulus di yang lain, menghilangkan kebutuhan untuk modifikasi kode apa pun.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Format file yang didukung

Aspose.OCR for Python via Java dapat bekerja dengan file Anda bisa mendapatkan dari pemindai atau kamera. Hasil pengakuan dapat disimpan, diimpor ke database, atau dianalisis secara real time.

Gambar

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Batch OCR

  • Multi-page PDF
  • ZIP
  • Folder

Hasil pengakuan

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalasi yang mudah untuk Python via Java

Aspose.ocr untuk Python via Java dikirimkan sebagai paket Python atau sebagai file yang dapat diunduh dengan dependensi minim. Mudah Instal ke dalam proyek Anda, dan Anda siap mengenali teks dalam beberapa bahasa yang didukung dan menyimpan hasil pengakuan dalam berbagai format.

Minta lisensi uji coba untuk memulai pengembangan aplikasi OCR yang berfungsi penuh tanpa batasan.

OCR yang kuat untuk aplikasi Python

Perpustakaan kami terintegrasi dengan mudah, memungkinkan aplikasi Python untuk berjalan dengan mulus di platform apa pun - desktop windows, Windows Server, MacOS, Linux, dan cloud.

140+ bahasa pengakuan

API Python dan Java OCR kami mengakui sejumlah besar bahasa dan skrip penulisan populer, termasuk bahasa campuran:

Tinggalkan deteksi bahasa ke perpustakaan atau tentukan bahasa sendiri untuk meningkatkan kinerja dan keandalan pengakuan.

  • ** Latin Latin ** Alfabet: Bahasa Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
  • ** Cyrillic ** Alphabet: Rusia, Ukraina, Kazakh, Serbia, Belarusan, Bulgaria;
  • Arab, Persia, Urdu;
  • Naskah Cina dan Devanagari, termasuk Hindi, Marathi, Bhojpuri, dan lainnya.

Filter pemrosesan gambar yang ditingkatkan

Ketepatan pengenalan karakter optik sangat bergantung pada kualitas gambar asli. Aspose.ocro untuk Python via Java menawarkan beragam filter pemrosesan gambar otomatis dan manual untuk mengoptimalkan gambar sebelum dikirimkan ke mesin OCR:

  • Luruskan gambar yang sedikit miring secara otomatis.
  • Perbaiki secara manual rotasi gambar yang sangat miring.
  • Secara otomatis menghilangkan kotoran, bintik -bintik, goresan, silau, gradien yang tidak diinginkan, dan jenis kebisingan lainnya.
  • Secara otomatis menyesuaikan kontras gambar.
  • Secara otomatis mewah atau mengubah ukuran gambar secara manual.
  • Konversi gambar menjadi hitam dan putih atau skala abu -abu.
  • Balikkan warna gambar, membuat area terang tampak gelap dan gelap tampak terang.
  • Tingkatkan ketebalan karakter dalam suatu gambar.
  • Gambar berisik yang blur sambil melestarikan tepi surat.
  • Lurus Halaman Miring dan Koreksi Lensa Kamera Distorsi di Foto Halaman.

API yang berspekulasi untuk berbagai jenis dokumen

Aspose.OCR untuk Python via Java menawarkan jaringan saraf yang terlatih khusus untuk mengekstrak teks dari jenis gambar tertentu dengan akurasi maksimum:

  • Kartu dan paspor ID yang dipindai atau difoto.
  • Plat nomor kendaraan.
  • Faktur.
  • Tanda terima.

Pemeriksa ejaan bawaan

Meskipun Aspose.OCR untuk Python via Java memberikan akurasi pengakuan tinggi, cacat pencetakan, kotoran, atau font non-standar dapat menyebabkan karakter atau kata-kata tertentu diakui secara tidak benar. Untuk lebih meningkatkan hasil pengenalan, Anda dapat menyalakan pemeriksa ejaan, yang menemukan dan secara otomatis mengoreksi kesalahan ejaan berdasarkan bahasa pengenalan yang dipilih.

Jika teks yang diakui berisi terminologi khusus, singkatan, dan kata -kata lain yang tidak ada dalam kamus ejaan umum, Anda dapat memberikan daftar kata Anda sendiri.

Pengakuan batch yang efisien

API Python OCR kami memberdayakan Anda untuk merampingkan pengenalan gambar. Memanfaatkan metode pemrosesan batch serbaguna untuk pemrosesan beberapa gambar yang efisien dalam satu panggilan:

  • Kenali PDF multi-halaman, file TIFF.
  • Proses semua file dalam folder.
  • Tangani pengenalan untuk semua file dalam arsip.
  • Mengenali gambar dari daftar yang ditentukan.

Belajar melalui contoh Python

Jelajahi berbagai contoh Python yang dirancang untuk membantu Anda dengan cepat memahami fungsi dan kemampuan solusi OCR kami. Dapatkan wawasan dengan cepat untuk menciptakan solusi khusus yang memenuhi kebutuhan bisnis spesifik Anda.

Fitur dan kemampuan

Aspose.OCR for Python via Java Jelajahi fitur canggih Aspose.ocr for Python

Feature icon

Foto OCR

Ekstrak teks dari foto smartphone dengan akurasi level pemindaian.

Feature icon

PDF yang dapat dicari

Konversi pemindaian apa pun menjadi dokumen yang dapat dicari dan dapat diindeks.

Feature icon

Pengakuan url

Kenali gambar dari URL tanpa mengunduhnya secara lokal.

Feature icon

Pengakuan curah

Baca semua gambar dari dokumen, folder, dan arsip multi-halaman.

Feature icon

Semua font dan gaya

Identifikasi dan kenali teks di semua jenis huruf dan gaya populer.

Feature icon

Pengenalan fine-tune

Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.

Feature icon

Pemeriksa ejaan

Meningkatkan hasil dengan secara otomatis mengoreksi kata -kata yang salah eja.

Feature icon

Temukan teks dalam gambar

Cari teks atau ekspresi reguler dalam satu set gambar.

Feature icon

Bandingkan teks gambar

Bandingkan teks pada dua gambar, terlepas dari kasing dan tata letak.

Sampel kode Python

Temukan sampel kode untuk mengintegrasikan aspose.ocrose dengan mulus untuk python melalui java ke dalam aplikasi Anda.

Instalasi yang mudah

Sebagai paket Python atau file yang dapat diunduh dengan dependensi minimal, Aspose.ocr untuk Python melalui Java memastikan distribusi yang mudah. Integrasikan ke dalam proyek Anda langsung dari Python, dan Anda siap untuk memanfaatkan kemampuan OCR lengkap, menyimpan hasil pengakuan dalam berbagai format.

pasca-pemasangan, segera dimulai menggunakan Aspose.ocr untuk Python melalui Java, meskipun dengan batasan tertentu. Lisensi sementara menghapus semua pembatasan versi percobaan selama 30 hari. Memanfaatkan periode ini untuk memulai pengembangan aplikasi OCR yang berfungsi penuh, yang memungkinkan Anda membuat keputusan berdasarkan informasi tentang pembelian aspose.ocr untuk python melalui java nanti.

Memuat lisensi

lic = License()
lic.set_license(self.licPath)

Pengenalan gambar

Tantangan utama dalam aplikasi OCR adalah kelangkaan pemindai untuk pengguna akhir. API kami, yang terintegrasi dengan Python via Java, menampilkan gambar pra-pemrosesan gambar yang kuat dan gambar yang diputar, miring, dan berisik. Dikombinasikan dengan dukungan untuk semua format gambar, ini memungkinkan pengakuan yang dapat diandalkan, bahkan dari foto smartphone. Sebagian besar pra-pemrosesan dan koreksi gambar otomatis, membutuhkan intervensi Anda hanya dalam kasus yang menantang.

Terapkan Koreksi Gambar Otomatis - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

API kami dengan mahir membaca gambar apa pun dari pemindai, kamera, atau smartphone: dokumen PDF, JPEG, PNG, TIFF, GIF, file BMP. Dukungan penuh untuk dokumen PDF multi-halaman, TIFF, dan gambar DJVU memastikan keserbagunaan. Anda juga dapat memberikan gambar dari web melalui URL.

Hasil pengakuan dikembalikan dalam format dokumen dan pertukaran data populer: teks biasa, PDF, Microsoft Word, Microsoft Excel, JSON, dan XML.

Kenali PDF dan simpan hasil untuk berbagai format output - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Mengoptimalkan penggunaan sumber daya

OCR menawarkan algoritma pengenalan khusus untuk mengekstraksi konten dari gambar dengan teks yang jarang dan latar belakang berisik/berwarna. Metode ini secara signifikan meningkatkan akurasi OCR dalam kasus bisnis berikut:

  • Baca teks dari foto jalanan.
  • Segmen dan identifikasi rambu -rambu jalan dan papan nama dalam gambar jalanan.
  • Temukan label harga dan menafsirkan teks yang diekstraksi sebagai harga.
  • Temukan dan agregat daerah yang menarik pada label makanan, seperti informasi nutrisi atau daftar bahan.
  • Mengidentifikasi dan menganalisis plat nomor mobil.
  • Ekstrak teks dari menu dan katalog.

Area Terbuka OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Mengekstrak teks dari foto jalanan

OCR untuk Python menawarkan algoritma pengakuan khusus yang mengekstraksi teks dari plat nomor kendaraan, termasuk foto gelap dan buram. Teks yang dihasilkan kemudian dapat disimpan secara otomatis ke database atau diverifikasi secara otomatis.

Kenali Nomor Mobil - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)