Penguasaan OCR dengan Python: Didukung oleh Aspose.OCR untuk Python melalui .NET
OCR: Ubah Gambar menjadi Teks dengan Python
Lebih banyak pameran ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Mengapa Memilih Aspose.OCR untuk Python melalui .NET?
Mulailah perjalanan dengan Aspose.OCR untuk Python melalui .NET – API OCR yang serbaguna dan mudah digunakan. Sematkan fungsionalitas OCR ke dalam aplikasi Python Anda dengan kurang dari 5 baris kode, sehingga menghilangkan kebutuhan matematika kompleks atau jaringan saraf. Mesin OCR kami yang kuat memberikan kecepatan dan akurasi yang tak tertandingi, mendukung lebih dari 130 bahasa, termasuk aksara Latin, Sirilik, Arab, Persia, India, dan Cina. Baik itu gambar pindaian, foto ponsel cerdas, tangkapan layar, atau PDF pindaian, dapatkan hasil dalam format pertukaran dokumen dan data yang populer. Manfaatkan filter pra-pemrosesan untuk menangani gambar yang diputar, miring, dan berisik. Optimalkan kinerja pengenalan dan beban sistem dengan memindahkan tugas-tugas intensif sumber daya ke backend .NET.
Penguasaan OCR yang Efisien dan Tepat
Rasakan kecepatan dan presisi tak tertandingi dalam hasil OCR dengan teknologi Python dan .NET yang canggih.
Keunggulan Multibahasa
Kenali teks dalam 130+ bahasa, mencakup aksara Latin, Sirilik, dan China dengan mudah dan presisi.
Pemrosesan Gambar yang Dapat Diadaptasi
Memproses gambar dengan mudah dari berbagai sumber – pemindai, kamera, dan ponsel cerdas – menggunakan Python dan .NET.
Kemahiran Karakter Cina
Dapatkan pengenalan yang tepat atas lebih dari 6.000 karakter Cina, pastikan akurasi dengan Python dan .NET.
Pelestarian Gaya Font dan Format
Pertahankan gaya dan pemformatan font untuk representasi teks yang akurat, tingkatkan keserbagunaan dengan Python dan .NET.
Contoh kode langsung
Rasakan kesederhanaan: Ubah gambar menjadi teks hanya dalam tiga baris kode Python!
* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Syarat Penggunaan Dan Kebijakan pribadi.
Ubah gambar menjadi teks
Temukan Lebih Banyak Contoh ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Pilih preferensi Anda
Pilih perpustakaan yang tepat untuk kebutuhan Anda. Jelajahi API yang tersedia dan kemampuannya untuk memilih solusi yang paling efisien.
Keserbagunaan
Python via .NET
Keseragaman
Python via Java
Pertunjukan
Python via C++
Pemberdayaan .NET untuk Python di Setiap Sudut
Aspose.OCR untuk Python melalui .NET beroperasi dengan lancar pada platform apa pun yang mendukung .NET Framework 4.0 dan yang lebih baru – baik itu mesin lokal, web server, atau cloud.
Format file yang didukung
Aspose.OCR for Python via .NET dapat bekerja dengan hampir semua file Anda bisa mendapatkannya dari pemindai atau kamera. Hasil pengenalan dikembalikan dalam format file dan pertukaran data terpopuler yang dapat disimpan, diimpor ke database, atau dianalisis secara real time.
Gambar-gambar
- JPEG
- PNG
- TIFF
- BMP
- GIF
Kumpulan OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Hasil pengakuan
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalasi untuk Python dengan backend .NET
Aspose.OCR untuk Python melalui .NET dikirimkan sebagai paket Python dengan dependensi minimal atau sebagai file yang dapat diunduh . Instal dengan mudah ke dalam proyek Anda, dan Anda siap mengenali teks dalam berbagai bahasa yang didukung dan menyimpan hasil pengenalan dalam berbagai format.
Minta lisensi uji coba untuk memulai pengembangan aplikasi OCR yang berfungsi penuh tanpa batasan.
OCR yang kuat untuk Aplikasi Python
Perpustakaan kami terintegrasi dengan mudah, memungkinkan aplikasi Python berjalan mulus di platform apa pun – desktop Windows, Windows Server, macOS, Linux, dan cloud.
130+ Bahasa Pengenalan
API Python dan .NET OCR kami mengenali banyak bahasa dan skrip penulisan populer, termasuk bahasa campuran:
Serahkan deteksi bahasa ke perpustakaan atau tentukan sendiri bahasanya untuk meningkatkan performa dan keandalan pengenalan.
- Alfabet Latin yang Diperluas: Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
- Alfabet Sirilik: Rusia, Ukraina, Kazakh, Serbia, Belarusia, Bulgaria;
- Arab, Persia, Urdu;
- Aksara Cina dan Dewanagari, termasuk Hindi, Marathi, Bhojpuri, dan lain-lain.
Filter pemrosesan yang kuat
Keakuratan dan keandalan pengenalan karakter optik sangat bergantung pada kualitas gambar aslinya. Aspose.OCR untuk Python melalui .NET menawarkan sejumlah besar filter pemrosesan gambar yang sepenuhnya otomatis dan manual yang menyempurnakan gambar sebelum dikirim ke mesin OCR:
- Secara otomatis meluruskan gambar yang disejajarkan dengan sedikit sudut terhadap horizontal.
- Memutar gambar yang sangat miring secara manual.
- Secara otomatis menghilangkan kotoran, noda, goresan, silau, gradien yang tidak diinginkan, dan kebisingan lainnya.
- Menyesuaikan kontras gambar secara otomatis.
- Secara otomatis meningkatkan, atau mengubah ukuran gambar secara manual.
- Ubah gambar menjadi hitam putih atau skala abu-abu.
- Balikkan warna gambar sehingga area terang tampak gelap dan area gelap tampak terang.
- Meningkatkan ketebalan karakter dalam gambar.
- Memburamkan gambar yang berisik sambil mempertahankan tepian huruf.
- Meluruskan kelengkungan halaman dan memperbaiki distorsi lensa kamera untuk foto halaman.
Dioptimalkan untuk jenis dokumen tertentu
Aspose.OCR untuk Python melalui .NET menawarkan jaringan saraf yang dilatih khusus untuk mengekstrak teks dari jenis gambar tertentu dengan akurasi maksimum:
Pemeriksa ejaan bawaan
Meskipun Aspose.OCR untuk Python melalui .NET memberikan akurasi pengenalan yang tinggi, cacat pencetakan, kotoran, atau font non-standar dapat menyebabkan karakter atau kata tertentu salah dikenali. Untuk lebih meningkatkan hasil pengenalan, Anda dapat mengaktifkan pemeriksa ejaan, yang menemukan dan secara otomatis memperbaiki kesalahan ejaan berdasarkan bahasa pengenalan yang dipilih.
Jika teks yang dikenali berisi terminologi khusus, singkatan, dan kata lain yang tidak ada dalam kamus ejaan umum, Anda dapat memberikan daftar kata Anda sendiri.
Pengenalan Batch Disederhanakan
API Python OCR kami membebaskan Anda dari mengenali gambar satu per satu. Gunakan berbagai metode pemrosesan batch untuk mengenali banyak gambar dalam satu panggilan:
- Pengenalan file PDF, TIFF, dan DjVu multi-halaman.
- Pengenalan semua file dalam satu folder.
- Pengenalan semua file dalam arsip.
- Pengenalan semua file dari daftar.
Belajar Melalui Contoh Python
Aspose.OCR untuk Python melalui .NET menyediakan serangkaian contoh yang ditulis dengan Python, memungkinkan Anda mengenal fungsinya dengan cepat dan kemampuan. Dapatkan wawasan untuk menciptakan solusi yang disesuaikan untuk memenuhi kebutuhan bisnis Python Anda.
Fitur dan Kemampuan
Aspose.OCR for Python via .NET Jelajahi kemampuan tingkat lanjut Aspose.OCR untuk C++.
Foto OCR
Ekstrak teks dari foto ponsel cerdas dengan akurasi tingkat pemindaian.
PDF yang dapat dicari
Ubah pindaian apa pun menjadi dokumen yang sepenuhnya dapat dicari dan diindeks.
Pengenalan URL
Kenali gambar dari URL tanpa mengunduhnya secara lokal.
Pengakuan massal
Baca semua gambar dari dokumen multi-halaman, folder, dan arsip.
Font dan gaya apa pun
Identifikasi dan kenali teks dalam semua tipografi dan gaya populer.
Sempurnakan pengenalan
Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.
Pemeriksa ejaan
Tingkatkan hasil dengan mengoreksi kata yang salah eja secara otomatis.
Temukan teks dalam gambar
Telusuri teks atau ekspresi reguler dalam kumpulan gambar.
Bandingkan teks gambar
Bandingkan teks pada dua gambar, apa pun kasus dan tata letaknya.
Contoh Kode Python
Pelajari contoh kode untuk mengintegrasikan Aspose.OCR untuk Python melalui .NET ke dalam aplikasi Python Anda dengan lancar.
Penguasaan Instalasi dengan Python
Didistribusikan sebagai Roda Python atau paket mandiri yang dapat diunduh, Aspose.OCR untuk Python melalui .NET mudah didistribusikan. Integrasi ke dalam proyek Python Anda, langsung dari Lingkungan Pengembangan Terpadu (IDE) Python pilihan Anda, adalah proses yang mulus. Cukup instal, dan Anda siap memanfaatkan keseluruhan kemampuan OCR, menyimpan hasil pengenalan dalam berbagai format.
Pasca instalasi, Anda dapat segera mulai menggunakan Aspose.OCR untuk Python melalui .NET , meskipun dengan batasan tertentu. Lisensi sementara menghilangkan semua batasan versi uji coba selama 30 hari. Manfaatkan periode ini untuk memulai pengembangan aplikasi OCR yang berfungsi penuh, memungkinkan Anda membuat keputusan yang tepat dalam membeli Aspose.OCR untuk Python melalui .NET pada tahap selanjutnya.
Memuat lisensi
lic = License()
lic.set_license(self.licPath)
Kenali teks di Foto
Membaca teks dari konten apa pun di Aspose.OCR untuk Python melalui .NET semudah memanggil metode universal recognition().
Ubah foto menjadi teks - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Konverter Universal Python
API kami dengan mahir membaca gambar apa pun dari pemindai, kamera, atau ponsel cerdas: dokumen PDF, JPEG, PNG, TIFF, GIF, gambar BMP, dan bahkan file DjVu. Dukungan penuh untuk dokumen PDF multi-halaman, TIFF, dan gambar DjVu memastikan keserbagunaan. Anda juga dapat memberikan gambar dari web melalui URL.
Hasil pengenalan dikembalikan dalam format dokumen dan pertukaran data populer: teks biasa, PDF, Microsoft Word, Microsoft Excel, JSON, dan XML.
Kenali PDF dan Simpan Hasil ke berbagai format keluaran - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimasi Sumber Daya dengan Python
Pengenalan karakter optik memerlukan sumber daya. API kami menawarkan cara fleksibel untuk menyeimbangkan triad klasik waktu-harga-kualitas:
- Pilih antara pengenalan menyeluruh dan pengenalan cepat.
- Tentukan jumlah thread yang dialokasikan untuk pengenalan, atau izinkan perpustakaan untuk secara otomatis menskalakan ke jumlah inti prosesor.
- Kosongkan CPU dengan memindahkan perhitungan ke backend .NET.
Pengenalan Cepat - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Kenali satu baris
Jika gambar Anda sudah dipangkas menjadi satu baris teks, gambar tersebut dapat dikenali dalam mode secepat mungkin, tanpa koreksi otomatis, deteksi struktur konten, dan langkah-langkah yang menghabiskan sumber daya lainnya. Ini dapat mempercepat OCR hingga 7 kali lebih cepat dari proses pengenalan normal.
Kenali satu baris teks pada gambar - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)