Perpustakaan Python OCR
Konversi gambar menjadi teks dengan Python OCR
Lebih banyak tampilan ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Mengapa Aspose.ocr untuk Python via .net?
Mulai dalam perjalanan dengan Aspose OCR untuk Python via .NET-OCR ACR yang serbaguna dan ramah pengguna. Sematkan fungsionalitas OCR ke dalam aplikasi Python Anda dengan kurang dari 5 baris kode, menghilangkan kebutuhan untuk matematika yang kompleks atau jaringan saraf. Mesin OCR kami yang kuat memberikan kecepatan dan akurasi yang tak tertandingi, mendukung 140+ bahasa, termasuk bahasa Inggris, Cyrillic, Arab, Persia, Hindi, Cina, Jepang, Korea, Tamil dan banyak lagi. Baik itu gambar yang dipindai, foto ponsel cerdas, tangkapan layar, atau PDF yang dipindai, mendapatkan hasil dalam format dokumen dan pertukaran data yang populer. Leverage filter pra-pemrosesan untuk menangani gambar yang diputar, miring, dan berisik.

OCR yang efisien dan tepat
Mengalami kecepatan dan ketepatan yang tak tertandingi dalam hasil OCR dengan teknologi Python canggih.
Multibahasa
Kenali teks dalam 140+ bahasa: Inggris, Prancis, Jerman, Spanyol, Rusia, Cina, Hindi, Jepang, Korea, Tamil, Arab, Persia, dan banyak lagi.
Universal
Memproses gambar dengan mudah dari beragam sumber - pemindai, kamera, dan smartphone - menggunakan Python.
Bahasa Asia
Mencapai pengakuan yang tepat dari naskah Cina, Arab, Devanagari dan Dravida, serta teks-teks berbahasa campuran.
Lindungi tata letak
Pertahankan pemformatan sumber untuk representasi teks yang akurat, dan kenali tabel.
Sampel Kode Langsung
Konversi gambar menjadi teks hanya dalam tiga baris kode Python. Coba sendiri!
* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Ketentuan Penggunaan Dan Kebijakan Privasi.
Konversi gambar ke teks
Temukan lebih banyak contoh ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Pilih preferensi Anda
Pilih perpustakaan yang tepat untuk kebutuhan Anda. Jelajahi API yang tersedia dan kemampuannya untuk memilih solusi yang paling efisien.
Keserbagunaan
Python via .NET
Keseragaman
Python via Java
Pertunjukan
Python via C++
Berjalan di mana -mana
Terlepas dari namanya, Aspose.ocr untuk Python melalui .NET tidak mengharuskan .NET untuk diinstal pada platform target. Paket instalasi sudah dilengkapi dengan semua komponen yang diperlukan dan dapat beroperasi dengan mulus di platform apa pun - baik itu mesin lokal, server web, atau cloud.
Format file yang didukung
Aspose.OCR for Python via .NET dapat bekerja dengan file Anda bisa mendapatkan dari pemindai atau kamera. Hasil pengakuan dapat disimpan, diimpor ke database, atau dianalisis secara real time.
Gambar
- JPEG
- PNG
- TIFF
- BMP
- GIF
Batch OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Hasil pengakuan
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalasi
Aspose.ocr untuk python via .net dikirimkan sebagai paket python dengan dependensi minimal atau sebagai file yang dapat diunduh atau [paket pypi](https:/pypi.org/project/ocaspose-pypose](https:/pypi.org/project/ocaspose](https:/pypi.org/project/ocaspose](https:/pypi.org/project/ocaspose](https:/pypi.orgyg/project/ocaspose](https:/pypi.orgeCt/ocroCaspose Mudah Instal ke dalam proyek Anda, dan Anda siap mengenali teks dalam 140+ bahasa dan menyimpan hasil pengakuan dalam berbagai format.
Minta lisensi uji coba untuk memulai pengembangan aplikasi OCR yang berfungsi penuh tanpa batasan.
OCR di bawah Python
Perpustakaan kami terintegrasi dengan mudah, memungkinkan aplikasi Python untuk berjalan dengan mulus di platform apa pun - desktop windows, Windows Server, MacOS, Linux, dan cloud.
140+ bahasa pengakuan
Perpustakaan Java OCR kami adalah solusi universal untuk pemrosesan dokumen, ekstraksi data, dan digitalisasi konten pada skala global. Dengan dukungan untuk sejumlah besar skrip menulis Eropa, Timur Tengah dan Asia, itu diadaptasi dengan baik untuk negara dan bisnis mana pun.
Aspose OCR untuk Java mengenali teks dalam dokumen multibahasa, seperti Cina/Inggris, Arab/Prancis, atau Cyrillic/Inggris. Bahasa berikut didukung:
- ** Latin yang diperluas **: Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
- ** Cyrillic ** Alfabet: Rusia, Ukraina, Kazakh, Bulgaria, termasuk teks Cixed Cyrillic/Inggris;
- Arab, Persia, Urdu, termasuk teks yang dicampur dengan bahasa Inggris;
- Bahasa Cina, Korea, Jepang, Devanagari, dan Dravida, termasuk Hindi, Tamil, Marathi, dan lainnya. Teks bahasa campuran juga didukung.
Filter pemrosesan yang kuat
Keakuratan dan keandalan pengenalan karakter optik sangat tergantung pada kualitas gambar asli. Aspose OCR untuk Python via .NET menawarkan sejumlah besar filter pemrosesan gambar otomatis dan manual yang meningkatkan gambar sebelum dikirim ke mesin OCR:
- Putar gambar terbalik dan diputar secara otomatis.
- Deteksi gambar terbalik dan ekstrak teks putih-ke-hitam.
- Secara otomatis menghilangkan kotoran, bintik -bintik, goresan, silau, gradien yang tidak diinginkan, dan kebisingan lainnya.
- Secara otomatis menyesuaikan kontras gambar.
- Secara otomatis mewah, atau mengubah ukuran gambar secara manual.
- Konversi gambar menjadi hitam dan putih atau skala abu -abu.
- Temukan bidang gambar yang berpotensi bermasalah dan kembalikan informasi tentang jenis cacat dan koordinatnya.
- Tingkatkan ketebalan karakter dalam suatu gambar.
- Gambar berisik yang blur sambil melestarikan tepi surat.
- Luruskan kelengkungan halaman dan perbaiki distorsi lensa kamera untuk foto halaman.
Dioptimalkan untuk jenis dokumen tertentu
Aspose OCR untuk Python via .NET menawarkan jaringan saraf yang terlatih khusus untuk mengekstrak teks dari jenis gambar tertentu dengan akurasi maksimum:
Pemeriksa ejaan bawaan
Meskipun Perpustakaan Python OCR kami memberikan akurasi pengakuan tinggi, cacat pencetakan, kotoran, atau font non-standar dapat menyebabkan karakter atau kata-kata tertentu diakui secara tidak benar. Untuk lebih meningkatkan hasil pengenalan, Anda dapat menyalakan pemeriksa ejaan, yang menemukan dan secara otomatis mengoreksi kesalahan ejaan berdasarkan bahasa pengenalan yang dipilih.
Jika teks yang diakui berisi terminologi khusus, singkatan, dan kata -kata lain yang tidak ada dalam kamus ejaan umum, Anda dapat memberikan daftar kata Anda sendiri.
Pengakuan batch
API Python OCR kami membebaskan Anda dari mengenali gambar satu per satu. Menggunakan berbagai metode pemrosesan batch untuk mengenali banyak gambar dalam satu panggilan:
- Pengakuan file multi-halaman PDF, TIFF, dan DJVU.
- Pengakuan semua file dalam folder.
- Pengakuan semua file dalam arsip.
- Pengakuan semua file dari daftar.
Belajar dengan sampel
OCR untuk Python menyediakan serangkaian contoh ditulis dalam python, memungkinkan Anda untuk dengan cepat berkenalan dengan fungsinya dan kemampuannya. Dapatkan wawasan untuk membuat solusi yang disesuaikan untuk memenuhi kebutuhan bisnis Python Anda.
Fitur dan kemampuan
Aspose.OCR for Python via .NET Aspose.ocr untuk python via .net memecahkan tugas Anda dengan cepat dan mudah.
Foto OCR
Ekstrak teks dari foto smartphone dengan akurasi level pemindaian.
PDF yang dapat dicari
Konversi pemindaian apa pun menjadi dokumen yang dapat dicari, dapat diindeks, dan dapat diedit.
Pengakuan url
Kenali gambar dari URL tanpa mengunduhnya secara lokal.
Pengakuan curah
Baca semua gambar dari dokumen, folder, dan arsip multi-halaman.
Semua font dan gaya
Identifikasi dan kenali teks di semua jenis huruf dan gaya populer.
Pengenalan fine-tune
Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.
Pemeriksa ejaan
Meningkatkan hasil dengan secara otomatis mengoreksi kata -kata yang salah eja.
Temukan teks dalam gambar
Cari teks atau ekspresi reguler dalam satu set gambar.
Bandingkan teks gambar
Bandingkan teks pada dua gambar, terlepas dari kasing dan tata letak.
Sampel kode Python
Selesaikan sampel kode untuk mengintegrasikan OCR dengan mulus ke dalam aplikasi Python Anda.
Instalasi
Didistribusikan sebagai roda ular python atau paket yang dapat diunduh mandiri, Aspose.ocr untuk Python via .NET mudah didistribusikan. Integrasi ke dalam proyek Python Anda, langsung dari lingkungan pengembangan terintegrasi Python (IDE) yang Anda sukai, adalah proses yang mulus. Cukup instal, dan Anda siap untuk memanfaatkan jangkauan lengkap kemampuan OCR, menghemat hasil pengakuan dalam berbagai format.
pasca-instalasi, Anda dapat segera mulai menggunakan aspose.ocr untuk python melalui .net, meskipun dengan batasan tertentu. Lisensi sementara mengangkat semua pembatasan versi percobaan selama 30 hari. Memanfaatkan periode ini untuk memulai pengembangan aplikasi OCR yang berfungsi penuh, yang memungkinkan Anda membuat keputusan berdasarkan informasi tentang pembelian aspose.ocr untuk python melalui .net pada tahap selanjutnya.
Memuat lisensi
lic = License()
lic.set_license(self.licPath)
Kenali teks di foto
Membaca teks dari konten apa pun dalam Aspose OCR untuk Python semudah memanggil metode pengakuan universal.
Konversi foto menjadi teks - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
API kami dengan mahir membaca gambar apa pun dari pemindai, kamera, atau smartphone: dokumen PDF, JPEG, PNG, TIFF, GIF, gambar BMP, dan bahkan file DJVU. Dukungan penuh untuk dokumen PDF multi-halaman, TIFF, dan gambar DJVU memastikan keserbagunaan. Anda juga dapat memberikan gambar dari web melalui URL.
Hasil pengakuan dikembalikan dalam format dokumen dan pertukaran data populer: teks biasa, PDF, Microsoft Word, Microsoft Excel, JSON, dan XML.
Kenali PDF dan simpan hasil untuk berbagai format output - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimalisasi Sumber Daya di Python
Pengenalan karakter optik menuntut sumber daya. API kami menawarkan cara fleksibel untuk menyeimbangkan triad berkualitas waktu klasik:
- Pilih antara pengakuan menyeluruh dan pengakuan cepat.
- Tentukan jumlah utas yang dialokasikan untuk pengakuan, atau memungkinkan perpustakaan untuk secara otomatis mengukur jumlah inti prosesor.
- Bebaskan CPU dengan membongkar perhitungan ke backend .net.
Pengakuan Cepat - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Kenali satu baris
Jika gambar Anda sudah dipangkas ke satu baris teks, itu dapat dikenali dalam mode tercepat, tanpa koreksi otomatis, deteksi struktur konten, dan langkah-langkah yang memakan sumber daya lainnya. Ini dapat mempercepat OCR hingga 7 kali lebih cepat dari proses pengenalan normal.
Kenali satu baris teks pada gambar - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)