Aspose.OCR  for Python via .NET

API pengenalan karakter optik untuk Python

Ekstrak teks dari gambar, foto, dan tangkapan layar yang dipindai, buat PDF yang dapat dicari, cari dan bandingkan teks dalam gambar, dan lainnya dari aplikasi Python.

  Download Free Trial
  
 

Aspose.OCR for Python via .NET adalah mesin pengenalan karakter optik (OCR) yang kuat dan mudah digunakan untuk aplikasi dan notebook Python Anda. Dalam kurang dari 10 baris kode, Anda dapat mengenali teks dalam 28 bahasa berdasarkan skrip Latin, Cyrillic, dan Asia, memberikan hasil dalam format pertukaran dokumen dan data yang paling populer. Tidak perlu mempelajari model matematika yang rumit, membuat algoritme pembelajaran mesin, dan melatih jaringan saraf — API kami yang sederhana dan tangguh akan melakukan segalanya untuk Anda.

Pustaka berfungsi sama baiknya dengan semua sumber, mulai dari pemindaian berkualitas tinggi hingga foto cepat di ponsel cerdas. Apakah gambar diputar, terdistorsi, atau berisik — filter pra dan pasca pemrosesan otomatis memberikan akurasi pengenalan tertinggi dalam waktu singkat.

Fitur dan kemampuan

Ekstrak teks dari pindaian, foto, dan tangkapan layar

Ubah PDF yang dipindai menjadi PDF yang dapat dicari dan diindeks

Baca skrip Latin, Cyrillic, dan Asia di semua tipografi populer

Kenali lebih dari 6.000 karakter Cina

Bekerja dengan gambar buram, terdistorsi, diputar, dan berisik

Identifikasi dan pertahankan blok konten dari tata letak teks asli

Mendeteksi dan membaca area gambar: paragraf, baris, dan kata tunggal

Proses massal dokumen, folder, dan arsip multi halaman

Kenali gambar dari Internet tanpa mengunduh

Mengidentifikasi dan mengoreksi kata yang salah eja secara otomatis

Temukan teks dalam gambar dan bandingkan teks gambar dengan cerdas

Mudah digunakan

Anda hanya memerlukan 5 baris kode untuk mengenali gambar dan menampilkan hasilnya. Ya, sesederhana itu!

Siap untuk mengenali Mengenali Jatuhkan file di sini atau klik untuk menelusuri *

* Dengan mengunggah file Anda atau menggunakan layanan, Anda setuju dengan kami Persyaratan penggunaan dan Kebijakan pribadi.

Contoh kode langsung - Python 3

# Inisialisasi mesin OCR
recognitionEngine = AsposeOcr()
# Tambahkan gambar ke kumpulan
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Ekstrak teks dari gambar
result = recognitionEngine.recognize(input)
# Menampilkan hasil pengenalan
print(result[0].recognition_text)
Hasil pengakuan
 

28 bahasa pengenalan

Aspose.OCR for Python via .NET dapat mengenali sejumlah besar bahasa dan semua skrip tulisan populer, termasuk teks dengan bahasa campuran:

  • Alfabet Latin yang diperluas: Kroasia, Ceko, Denmark, Belanda, Inggris (termasuk aksara tulisan tangan), Estonia, Finlandia, Prancis, Jerman, Italia, Latvia, Lituania, Norwegia, Polandia, Portugis, Rumania , Slowakia, Slovenia, Spanyol, Swedia.
  • Alfabet Sirilik: Belorusia, Bulgaria, Kazakh, Rusia, Serbia, Ukraina.
  • China: lebih dari 6.000 karakter.
  • Hindi

Anda juga dapat membaca teks dalam bahasa lain berdasarkan bahasa Latin dan Cyrillic yang diperluas, meskipun keduanya tidak didukung secara langsung oleh mesin OCR. Misalnya, bahasa Latin, Vietnam, Gaelik, dan sebagainya.

Filter pemrosesan yang kuat

Akurasi dan keandalan pengenalan karakter optik sangat bergantung pada kualitas gambar aslinya. Aspose.OCR for Python via .NET menawarkan sejumlah besar filter pemrosesan gambar otomatis dan manual yang menyempurnakan gambar sebelum dikirim ke mesin OCR:

  • Secara otomatis meluruskan gambar yang disejajarkan sedikit miring ke horizontal.
  • Putar gambar yang sangat miring secara manual.
  • Otomatis menghilangkan kotoran, noda, goresan, silau, gradien yang tidak diinginkan, dan kebisingan lainnya.
  • Sesuaikan kontras gambar secara otomatis.
  • Otomatis memperbesar, atau mengubah ukuran gambar secara manual.
  • Ubah gambar menjadi hitam putih atau skala abu-abu.
  • Balikkan warna gambar sehingga area terang tampak gelap dan area gelap tampak terang.
  • Meningkatkan ketebalan karakter dalam gambar.
  • Memburamkan gambar yang bising sambil mempertahankan tepi huruf.
  • Luruskan kelengkungan halaman dan perbaiki distorsi lensa kamera untuk foto halaman.

Filter ini dapat digabungkan dan diterapkan ke seluruh gambar atau hanya ke area gambar tertentu, serta dalam pemrosesan batch. Anda tidak hanya dapat menyempurnakan prapemrosesan dalam pipa pengenalan, tetapi Anda juga dapat menyimpan gambar yang telah diproses untuk ditampilkan, di-cache, dan di-debug.

Dioptimalkan untuk jenis dokumen tertentu

Aspose.OCR for Python via .NET menawarkan jaringan neural yang dilatih khusus untuk mengekstrak teks dari jenis gambar tertentu dengan akurasi maksimum:

  • KTP dan paspor yang dipindai atau difoto.
  • Plat nomor kendaraan.
  • Faktur.
  • Tanda terima.

Pemeriksa ejaan bawaan

Meskipun Aspose.OCR for Python via .NET memberikan akurasi pengenalan yang tinggi, cacat pencetakan, kotoran, atau font non-standar dapat menyebabkan karakter atau kata tertentu dikenali secara tidak benar. Untuk lebih menyempurnakan hasil pengenalan, Anda dapat mengaktifkan pemeriksa ejaan, yang menemukan dan mengoreksi kesalahan ejaan secara otomatis berdasarkan bahasa pengenalan yang dipilih.

Jika teks yang dikenali berisi terminologi khusus, singkatan, dan kata lain yang tidak terdapat dalam kamus ejaan umum, Anda dapat menyediakan daftar kata Anda sendiri.

Membuat PDF yang dapat ditelusuri

Bahkan dengan akurasi pengenalan tertinggi, gambar asli mungkin berisi banyak informasi penting non-tekstual atau hanya memiliki nilai sejarah yang tinggi. Aspose.OCR for Python via .NET menawarkan solusi sederhana dan elegan untuk menggabungkan yang terbaik dari kedua dunia. Kami mengekstrak teks dari gambar, dokumen PDF, atau paket file dan menempatkannya sebagai lapisan teks tak terlihat di atas gambar asli. Hasilnya disimpan dalam format PDF, yang merupakan standar industri untuk menyimpan dan berbagi dokumen. File yang dihasilkan dapat dicari dan diindeks, dan teks dapat dipilih dan disalin dengan cara yang sama seperti jika Anda memilih dan menyalin karakter aslinya.

Pengakuan massal

Aspose.OCR for Python via .NET memungkinkan Anda untuk mengenali banyak file, terlepas dari jumlah dan jenisnya, semudah membaca satu gambar. Dengan satu panggilan API, Anda dapat mengenali beberapa halaman dari pemindai umpan otomatis atau mengekstrak pelat nomor kendaraan dari kamera lalu lintas otomatis.

Hasilnya dapat disimpan sebagai dokumen PDF atau spreadsheet yang dapat ditelusuri, atau dikembalikan sebagai teks biasa, JSON, atau XML untuk analisis lebih lanjut.

  

Support and Learning Resources

  
  

Aspose juga menawarkan API OCR asli untuk bahasa pemrograman populer lainnya: