Konversi gambar ke teks dengan Python OCR API via Java
Mengenali teks dalam gambar dengan python
Lebih banyak tampilan ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Mengapa Aspose.ocr untuk Python via Java?
Aspose.ocr untuk Python melalui Java dengan mulus mengintegrasikan kemampuan pengenalan karakter optik yang kuat (OCR) ke dalam notebook dan aplikasi python lintas platform Anda. Dengan API intuitif dan berkecepatan tinggi kami, Anda dapat dengan mudah mengekstrak teks dari pemindaian, tangkapan layar, tautan web, atau foto ponsel cerdas, memberikan hasil yang siap untuk konsolidasi, analisis, atau penyimpanan. Kenali gambar yang dipindai, foto ponsel cerdas, tangkapan layar, dan PDF yang dipindai, menyimpan hasil dalam format dokumen populer. Filter pra-pemrosesan canggih menangani gambar yang diputar, miring, dan berisik. Optimalkan kinerja dengan membongkar tugas ke GPU.

OCR yang cepat dan akurat
Mencapai hasil OCR berkecepatan tinggi dan akurat dengan python canggih kami melalui teknologi Java.
Dukungan multibahasa
Kenali teks dalam 140+ bahasa, termasuk skrip Latin, Cyrillic, Arab, Persia, Indic, dan Cina, memastikan keserbagunaan untuk aplikasi Python Anda melalui Java.
Dukungan gambar yang fleksibel
Proses gambar dari pemindai, kamera, dan smartphone mulus dengan Python melalui Java.
Ketepatan dalam pengenalan karakter Cina
Kenali lebih dari 6.000 karakter Cina dengan presisi dalam proyek Python Anda melalui Java.
Mempertahankan gaya dan format font
Pertahankan gaya font dan pemformatan untuk representasi yang akurat dari teks yang diakui dalam aplikasi Python Anda melalui Java.
Sampel Kode Langsung
Memulai pengenalan teks dari gambar hanya dalam tiga baris kode. Rasakan kesederhanaan!
* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Ketentuan Penggunaan Dan Kebijakan Privasi.
Konversi gambar ke teks
Lebih banyak contoh ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Pilih preferensi Anda
Pilih perpustakaan yang tepat untuk kebutuhan Anda. Jelajahi API yang tersedia dan kemampuannya untuk memilih solusi yang paling efisien.
Keserbagunaan
Python via .NET
Keseragaman
Python via Java
Pertunjukan
Python via C++
Java Backend Compatibility
Dirancang sebagai modul Python, perpustakaan kami memastikan kompatibilitas di seluruh sistem operasi utama yang mendukung Java - termasuk Microsoft Windows, Linux, dan MacOS, atau platform cloud. Ini memungkinkan Anda untuk mengembangkan aplikasi pada satu platform dan menjalankannya dengan mulus di yang lain, menghilangkan kebutuhan untuk modifikasi kode apa pun.
Format file yang didukung
Aspose.OCR for Python via Java dapat bekerja dengan file Anda bisa mendapatkan dari pemindai atau kamera. Hasil pengakuan dapat disimpan, diimpor ke database, atau dianalisis secara real time.
Gambar
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Batch OCR
- Multi-page PDF
- ZIP
- Folder
Hasil pengakuan
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalasi yang mudah untuk Python via Java
Aspose.ocr untuk Python via Java dikirimkan sebagai paket Python atau sebagai file yang dapat diunduh dengan dependensi minim. Mudah Instal ke dalam proyek Anda, dan Anda siap mengenali teks dalam beberapa bahasa yang didukung dan menyimpan hasil pengakuan dalam berbagai format.
Minta lisensi uji coba untuk memulai pengembangan aplikasi OCR yang berfungsi penuh tanpa batasan.
OCR yang kuat untuk aplikasi Python
Perpustakaan kami terintegrasi dengan mudah, memungkinkan aplikasi Python untuk berjalan dengan mulus di platform apa pun - desktop windows, Windows Server, MacOS, Linux, dan cloud.
140+ bahasa pengakuan
API Python dan Java OCR kami mengakui sejumlah besar bahasa dan skrip penulisan populer, termasuk bahasa campuran:
Tinggalkan deteksi bahasa ke perpustakaan atau tentukan bahasa sendiri untuk meningkatkan kinerja dan keandalan pengakuan.
- ** Latin Latin ** Alfabet: Bahasa Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
- ** Cyrillic ** Alphabet: Rusia, Ukraina, Kazakh, Serbia, Belarusan, Bulgaria;
- Arab, Persia, Urdu;
- Naskah Cina dan Devanagari, termasuk Hindi, Marathi, Bhojpuri, dan lainnya.
Filter pemrosesan gambar yang ditingkatkan
Ketepatan pengenalan karakter optik sangat bergantung pada kualitas gambar asli. Aspose.ocro untuk Python via Java menawarkan beragam filter pemrosesan gambar otomatis dan manual untuk mengoptimalkan gambar sebelum dikirimkan ke mesin OCR:
- Luruskan gambar yang sedikit miring secara otomatis.
- Perbaiki secara manual rotasi gambar yang sangat miring.
- Secara otomatis menghilangkan kotoran, bintik -bintik, goresan, silau, gradien yang tidak diinginkan, dan jenis kebisingan lainnya.
- Secara otomatis menyesuaikan kontras gambar.
- Secara otomatis mewah atau mengubah ukuran gambar secara manual.
- Konversi gambar menjadi hitam dan putih atau skala abu -abu.
- Balikkan warna gambar, membuat area terang tampak gelap dan gelap tampak terang.
- Tingkatkan ketebalan karakter dalam suatu gambar.
- Gambar berisik yang blur sambil melestarikan tepi surat.
- Lurus Halaman Miring dan Koreksi Lensa Kamera Distorsi di Foto Halaman.
API yang berspekulasi untuk berbagai jenis dokumen
Aspose.OCR untuk Python via Java menawarkan jaringan saraf yang terlatih khusus untuk mengekstrak teks dari jenis gambar tertentu dengan akurasi maksimum:
- Kartu dan paspor ID yang dipindai atau difoto.
- Plat nomor kendaraan.
- Faktur.
- Tanda terima.
Pemeriksa ejaan bawaan
Meskipun Aspose.OCR untuk Python via Java memberikan akurasi pengakuan tinggi, cacat pencetakan, kotoran, atau font non-standar dapat menyebabkan karakter atau kata-kata tertentu diakui secara tidak benar. Untuk lebih meningkatkan hasil pengenalan, Anda dapat menyalakan pemeriksa ejaan, yang menemukan dan secara otomatis mengoreksi kesalahan ejaan berdasarkan bahasa pengenalan yang dipilih.
Jika teks yang diakui berisi terminologi khusus, singkatan, dan kata -kata lain yang tidak ada dalam kamus ejaan umum, Anda dapat memberikan daftar kata Anda sendiri.
Pengakuan batch yang efisien
API Python OCR kami memberdayakan Anda untuk merampingkan pengenalan gambar. Memanfaatkan metode pemrosesan batch serbaguna untuk pemrosesan beberapa gambar yang efisien dalam satu panggilan:
- Kenali PDF multi-halaman, file TIFF.
- Proses semua file dalam folder.
- Tangani pengenalan untuk semua file dalam arsip.
- Mengenali gambar dari daftar yang ditentukan.
Belajar melalui contoh Python
Jelajahi berbagai contoh Python yang dirancang untuk membantu Anda dengan cepat memahami fungsi dan kemampuan solusi OCR kami. Dapatkan wawasan dengan cepat untuk menciptakan solusi khusus yang memenuhi kebutuhan bisnis spesifik Anda.
Fitur dan kemampuan
Aspose.OCR for Python via Java Jelajahi fitur canggih Aspose.ocr for Python
Foto OCR
Ekstrak teks dari foto smartphone dengan akurasi level pemindaian.
PDF yang dapat dicari
Konversi pemindaian apa pun menjadi dokumen yang dapat dicari dan dapat diindeks.
Pengakuan url
Kenali gambar dari URL tanpa mengunduhnya secara lokal.
Pengakuan curah
Baca semua gambar dari dokumen, folder, dan arsip multi-halaman.
Semua font dan gaya
Identifikasi dan kenali teks di semua jenis huruf dan gaya populer.
Pengenalan fine-tune
Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.
Pemeriksa ejaan
Meningkatkan hasil dengan secara otomatis mengoreksi kata -kata yang salah eja.
Temukan teks dalam gambar
Cari teks atau ekspresi reguler dalam satu set gambar.
Bandingkan teks gambar
Bandingkan teks pada dua gambar, terlepas dari kasing dan tata letak.
Sampel kode Python
Temukan sampel kode untuk mengintegrasikan aspose.ocrose dengan mulus untuk python melalui java ke dalam aplikasi Anda.
Instalasi yang mudah
Sebagai paket Python atau file yang dapat diunduh dengan dependensi minimal, Aspose.ocr untuk Python melalui Java memastikan distribusi yang mudah. Integrasikan ke dalam proyek Anda langsung dari Python, dan Anda siap untuk memanfaatkan kemampuan OCR lengkap, menyimpan hasil pengakuan dalam berbagai format.
pasca-pemasangan, segera dimulai menggunakan Aspose.ocr untuk Python melalui Java, meskipun dengan batasan tertentu. Lisensi sementara menghapus semua pembatasan versi percobaan selama 30 hari. Memanfaatkan periode ini untuk memulai pengembangan aplikasi OCR yang berfungsi penuh, yang memungkinkan Anda membuat keputusan berdasarkan informasi tentang pembelian aspose.ocr untuk python melalui java nanti.
Memuat lisensi
lic = License()
lic.set_license(self.licPath)
Pengenalan gambar
Tantangan utama dalam aplikasi OCR adalah kelangkaan pemindai untuk pengguna akhir. API kami, yang terintegrasi dengan Python via Java, menampilkan gambar pra-pemrosesan gambar yang kuat dan gambar yang diputar, miring, dan berisik. Dikombinasikan dengan dukungan untuk semua format gambar, ini memungkinkan pengakuan yang dapat diandalkan, bahkan dari foto smartphone. Sebagian besar pra-pemrosesan dan koreksi gambar otomatis, membutuhkan intervensi Anda hanya dalam kasus yang menantang.
Terapkan Koreksi Gambar Otomatis - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
API kami dengan mahir membaca gambar apa pun dari pemindai, kamera, atau smartphone: dokumen PDF, JPEG, PNG, TIFF, GIF, file BMP. Dukungan penuh untuk dokumen PDF multi-halaman, TIFF, dan gambar DJVU memastikan keserbagunaan. Anda juga dapat memberikan gambar dari web melalui URL.
Hasil pengakuan dikembalikan dalam format dokumen dan pertukaran data populer: teks biasa, PDF, Microsoft Word, Microsoft Excel, JSON, dan XML.
Kenali PDF dan simpan hasil untuk berbagai format output - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Mengoptimalkan penggunaan sumber daya
OCR menawarkan algoritma pengenalan khusus untuk mengekstraksi konten dari gambar dengan teks yang jarang dan latar belakang berisik/berwarna. Metode ini secara signifikan meningkatkan akurasi OCR dalam kasus bisnis berikut:
- Baca teks dari foto jalanan.
- Segmen dan identifikasi rambu -rambu jalan dan papan nama dalam gambar jalanan.
- Temukan label harga dan menafsirkan teks yang diekstraksi sebagai harga.
- Temukan dan agregat daerah yang menarik pada label makanan, seperti informasi nutrisi atau daftar bahan.
- Mengidentifikasi dan menganalisis plat nomor mobil.
- Ekstrak teks dari menu dan katalog.
Area Terbuka OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Mengekstrak teks dari foto jalanan
OCR untuk Python menawarkan algoritma pengakuan khusus yang mengekstraksi teks dari plat nomor kendaraan, termasuk foto gelap dan buram. Teks yang dihasilkan kemudian dapat disimpan secara otomatis ke database atau diverifikasi secara otomatis.
Kenali Nomor Mobil - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)