Konversi gambar menjadi teks dengan Python OCR API melalui Java
Kenali Teks dalam Gambar dengan Python
Lebih banyak pameran ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Mengapa Aspose.OCR untuk Python melalui Java?
Aspose.OCR untuk Python melalui Java dengan mulus mengintegrasikan kemampuan pengenalan karakter optik (OCR) yang kuat ke dalam notebook dan aplikasi Python lintas platform Anda. Dengan API kami yang intuitif dan berkecepatan tinggi, Anda dapat dengan mudah mengekstrak teks dari pindaian, tangkapan layar, tautan web, atau foto ponsel cerdas, memberikan hasil yang siap untuk konsolidasi, analisis, atau penyimpanan. Kenali gambar pindaian, foto ponsel cerdas, tangkapan layar, dan PDF pindaian, simpan hasilnya dalam format dokumen populer. Filter pra-pemrosesan tingkat lanjut menangani gambar yang diputar, miring, dan berisik. Optimalkan kinerja dengan memindahkan tugas ke GPU.
OCR yang Cepat dan Akurat
Raih hasil OCR berkecepatan tinggi dan akurat dengan Python canggih kami melalui teknologi Java.
Dukungan Multibahasa
Kenali teks dalam 130+ bahasa, termasuk skrip Latin, Sirilik, Arab, Persia, India, dan Tiongkok, memastikan keserbagunaan untuk aplikasi Python Anda melalui Java.
Dukungan Gambar Fleksibel
Proses gambar dari pemindai, kamera, dan ponsel cerdas secara lancar dengan Python melalui Java.
Presisi dalam Pengenalan Karakter Cina
Kenali lebih dari 6.000 karakter Cina dengan presisi dalam proyek Python Anda melalui Java.
Pertahankan Gaya dan Pemformatan Font
Pertahankan gaya dan pemformatan font untuk representasi akurat teks yang dikenali dalam aplikasi Python Anda melalui Java.
Contoh kode langsung
Mulai pengenalan teks dari gambar hanya dalam tiga baris kode. Rasakan kesederhanaannya!
* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Ketentuan penggunaan Dan Kebijakan Privasi.
Ubah gambar menjadi teks
Lebih banyak contoh ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Pilih preferensi Anda
Pilih perpustakaan yang tepat untuk kebutuhan Anda. Jelajahi API yang tersedia dan kemampuannya untuk memilih solusi yang paling efisien.
Keserbagunaan
Python via .NET
Keseragaman
Python via Java
Pertunjukan
Python via C++
Kompatibilitas Backend Java
Dirancang sebagai modul Python, perpustakaan kami memastikan kompatibilitas di seluruh sistem operasi utama yang mendukung Java - termasuk Microsoft Windows, Linux, dan macOS, atau platform awan. Hal ini memungkinkan Anda mengembangkan aplikasi di satu platform dan menjalankannya dengan lancar di platform lain, sehingga menghilangkan kebutuhan akan modifikasi kode apa pun.
Format file yang didukung
Aspose.OCR for Python via Java dapat bekerja dengan [file]apa pun( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) Anda bisa mendapatkannya dari pemindai atau kamera. Hasil pengenalan dapat disimpan, diimpor ke database, atau dianalisis secara real time.
Gambar
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Kumpulan OCR
- Multi-page PDF
- ZIP
- Folder
Hasil pengakuan
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalasi Mudah untuk Python melalui Java
Aspose.OCR untuk Python melalui Java dikirimkan sebagai paket Python atau sebagai file yang dapat diunduh dengan ketergantungan minimal. Instal dengan mudah ke dalam proyek Anda, dan Anda siap mengenali teks dalam berbagai bahasa yang didukung dan menyimpan hasil pengenalan dalam berbagai format.
Minta lisensi uji coba untuk memulai pengembangan aplikasi OCR yang berfungsi penuh tanpa batasan.
OCR yang kuat untuk Aplikasi Python
Perpustakaan kami terintegrasi dengan mudah, memungkinkan aplikasi Python berjalan mulus di platform apa pun – desktop Windows, Windows Server, macOS, Linux, dan cloud.
130+ Bahasa Pengenalan
API OCR Python dan Java kami mengenali banyak bahasa dan skrip penulisan populer, termasuk bahasa campuran:
Serahkan deteksi bahasa ke perpustakaan atau tentukan sendiri bahasanya untuk meningkatkan performa dan keandalan pengenalan.
- Alfabet Latin yang Diperluas: Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
- Alfabet Sirilik: Rusia, Ukraina, Kazakh, Serbia, Belarusia, Bulgaria;
- Arab, Persia, Urdu;
- Aksara Cina dan Dewanagari, termasuk Hindi, Marathi, Bhojpuri, dan lain-lain.
Filter Pemrosesan Gambar yang Ditingkatkan
Ketepatan pengenalan karakter optik sangat bergantung pada kualitas gambar aslinya. Aspose.OCR untuk Python melalui Java menawarkan beragam filter pemrosesan gambar otomatis dan manual untuk mengoptimalkan gambar sebelum dikirimkan ke mesin OCR:
- Secara otomatis meluruskan gambar yang sedikit miring.
- Perbaiki rotasi gambar yang sangat miring secara manual.
- Secara otomatis menghilangkan kotoran, noda, goresan, silau, gradien yang tidak diinginkan, dan jenis kebisingan lainnya.
- Menyesuaikan kontras gambar secara otomatis.
- Secara otomatis meningkatkan atau mengubah ukuran gambar secara manual.
- Ubah gambar menjadi hitam putih atau skala abu-abu.
- Membalikkan warna gambar, membuat area terang tampak gelap dan area gelap tampak terang.
- Meningkatkan ketebalan karakter dalam gambar.
- Memburamkan gambar yang berisik sambil mempertahankan tepi huruf.
- Luruskan kemiringan halaman dan perbaiki distorsi lensa kamera pada halaman foto.
API khusus untuk berbagai jenis dokumen
Aspose.OCR untuk Python melalui Java menawarkan jaringan saraf yang dilatih khusus untuk mengekstrak teks dari jenis gambar tertentu dengan akurasi maksimum:
- Kartu identitas dan paspor yang dipindai atau difoto.
- Pelat nomor kendaraan.
- Faktur.
- Tanda terima.
Pemeriksa ejaan bawaan
Meskipun Aspose.OCR untuk Python melalui Java memberikan akurasi pengenalan yang tinggi, cacat pencetakan, kotoran, atau font non-standar dapat menyebabkan karakter atau kata tertentu salah dikenali. Untuk lebih meningkatkan hasil pengenalan, Anda dapat mengaktifkan pemeriksa ejaan, yang menemukan dan secara otomatis memperbaiki kesalahan ejaan berdasarkan bahasa pengenalan yang dipilih.
Jika teks yang dikenali berisi terminologi khusus, singkatan, dan kata lain yang tidak ada dalam kamus ejaan umum, Anda dapat memberikan daftar kata Anda sendiri.
Pengenalan Batch yang Efisien
API Python OCR kami memberdayakan Anda untuk menyederhanakan pengenalan gambar. Manfaatkan metode pemrosesan batch serbaguna untuk pemrosesan banyak gambar secara efisien dalam satu panggilan:
- Kenali file PDF multi-halaman, TIFF.
- Memproses semua file dalam satu folder.
- Menangani pengenalan untuk semua file dalam arsip.
- Kenali gambar dari daftar tertentu.
Belajar melalui Contoh Python
Jelajahi berbagai contoh Python yang dirancang untuk membantu Anda memahami dengan cepat fungsi dan kemampuan solusi OCR kami. Dapatkan wawasan dengan cepat dalam menciptakan solusi khusus yang memenuhi kebutuhan spesifik bisnis Anda.
Fitur dan Kemampuan
Aspose.OCR for Python via Java Jelajahi fitur lanjutan Aspose.OCR untuk Python
Foto OCR
Ekstrak teks dari foto ponsel cerdas dengan akurasi tingkat pemindaian.
PDF yang dapat dicari
Ubah pindaian apa pun menjadi dokumen yang sepenuhnya dapat dicari dan diindeks.
Pengenalan URL
Kenali gambar dari URL tanpa mengunduhnya secara lokal.
Pengakuan massal
Baca semua gambar dari dokumen multi-halaman, folder, dan arsip.
Font dan gaya apa pun
Identifikasi dan kenali teks dalam semua tipografi dan gaya populer.
Sempurnakan pengenalan
Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.
Pemeriksa ejaan
Tingkatkan hasil dengan mengoreksi kata yang salah eja secara otomatis.
Temukan teks dalam gambar
Telusuri teks atau ekspresi reguler dalam kumpulan gambar.
Bandingkan teks gambar
Bandingkan teks pada dua gambar, apa pun kasus dan tata letaknya.
Contoh Kode Python
Temukan contoh kode untuk mengintegrasikan Aspose.OCR untuk Python melalui Java ke dalam aplikasi Anda dengan lancar.
Instalasi Mudah
Sebagai paket Python atau file yang dapat diunduh dengan ketergantungan minimal, Aspose.OCR untuk Python melalui Java memastikan distribusi yang mudah. Integrasikan ke dalam proyek Anda langsung dari Python, dan Anda siap memanfaatkan kemampuan OCR yang lengkap, menyimpan hasil pengenalan dalam berbagai format.
Pasca instalasi, segera mulai menggunakan Aspose.OCR untuk Python melalui Java, meskipun dengan keterbatasan tertentu. Lisensi sementara menghapus semua batasan versi uji coba selama 30 hari. Manfaatkan periode ini untuk memulai pengembangan aplikasi OCR yang berfungsi penuh, memungkinkan Anda membuat keputusan yang tepat untuk membeli Aspose.OCR untuk Python melalui Java nanti.
Memuat lisensi
lic = License()
lic.set_license(self.licPath)
Pengenalan Gambar
Tantangan utama dalam aplikasi OCR adalah kelangkaan pemindai bagi pengguna akhir. API kami, terintegrasi secara mulus dengan Python melalui Java, dilengkapi filter pra-pemrosesan gambar bawaan yang kuat yang menangani gambar yang diputar, miring, dan berisik. Dikombinasikan dengan dukungan untuk semua format gambar, memungkinkan pengenalan yang andal, bahkan dari foto ponsel cerdas. Sebagian besar pra-pemrosesan dan koreksi gambar dilakukan secara otomatis, sehingga memerlukan intervensi Anda hanya dalam kasus-kasus sulit.
Terapkan koreksi gambar otomatis - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Konverter Universal Python
API kami dengan mahir membaca gambar apa pun dari pemindai, kamera, atau ponsel cerdas: dokumen PDF, file JPEG, PNG, TIFF, GIF, BMP. Dukungan penuh untuk dokumen PDF multi-halaman, TIFF, dan gambar DjVu memastikan keserbagunaan. Anda juga dapat memberikan gambar dari web melalui URL.
Hasil pengenalan dikembalikan dalam format dokumen dan pertukaran data populer: teks biasa, PDF, Microsoft Word, Microsoft Excel, JSON, dan XML.
Kenali PDF dan Simpan Hasil ke berbagai format keluaran - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Mengoptimalkan Penggunaan Sumber Daya
OCR menawarkan algoritme pengenalan khusus untuk mengekstraksi konten dari gambar dengan teks jarang dan latar belakang berisik/berwarna. Metode ini secara signifikan meningkatkan akurasi OCR dalam kasus bisnis berikut:
- Membaca teks dari foto jalanan.
- Segmentasikan dan identifikasi rambu dan papan tanda jalan dalam gambar jalan.
- Temukan label harga dan tafsirkan teks yang diekstraksi sebagai harga.
- Temukan dan gabungkan wilayah yang diminati pada label makanan, seperti informasi nutrisi atau daftar bahan.
- Mengidentifikasi dan menganalisis plat nomor mobil.
- Ekstrak teks dari menu dan katalog.
Area terbuka OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Mengekstrak teks dari foto jalanan
OCR untuk Python menawarkan algoritma pengenalan khusus yang mengekstrak teks dari pelat nomor kendaraan, termasuk foto gelap dan buram. Teks yang dihasilkan kemudian dapat disimpan secara otomatis ke database atau diverifikasi secara otomatis.
Kenali nomor mobil - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)