Mengapa Aspose.ocr untuk Python via .net?

Mulai dalam perjalanan dengan Aspose OCR untuk Python via .NET-OCR ACR yang serbaguna dan ramah pengguna. Sematkan fungsionalitas OCR ke dalam aplikasi Python Anda dengan kurang dari 5 baris kode, menghilangkan kebutuhan untuk matematika yang kompleks atau jaringan saraf. Mesin OCR kami yang kuat memberikan kecepatan dan akurasi yang tak tertandingi, mendukung 140+ bahasa, termasuk bahasa Inggris, Cyrillic, Arab, Persia, Hindi, Cina, Jepang, Korea, Tamil dan banyak lagi. Baik itu gambar yang dipindai, foto ponsel cerdas, tangkapan layar, atau PDF yang dipindai, mendapatkan hasil dalam format dokumen dan pertukaran data yang populer. Leverage filter pra-pemrosesan untuk menangani gambar yang diputar, miring, dan berisik.

Illustration ocr

OCR yang efisien dan tepat

Mengalami kecepatan dan ketepatan yang tak tertandingi dalam hasil OCR dengan teknologi Python canggih.

Multibahasa

Kenali teks dalam 140+ bahasa: Inggris, Prancis, Jerman, Spanyol, Rusia, Cina, Hindi, Jepang, Korea, Tamil, Arab, Persia, dan banyak lagi.

Universal

Memproses gambar dengan mudah dari beragam sumber - pemindai, kamera, dan smartphone - menggunakan Python.

Bahasa Asia

Mencapai pengakuan yang tepat dari naskah Cina, Arab, Devanagari dan Dravida, serta teks-teks berbahasa campuran.

Lindungi tata letak

Pertahankan pemformatan sumber untuk representasi teks yang akurat, dan kenali tabel.

Sampel Kode Langsung

Konversi gambar menjadi teks hanya dalam tiga baris kode Python. Coba sendiri!

Siap untuk dikenali Siap untuk dikenali Jatuhkan file di sini atau klik untuk menelusuri *

* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Ketentuan Penggunaan Dan Kebijakan Privasi.

Hasil pengakuan
 

Konversi gambar ke teks

Temukan lebih banyak contoh >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Pilih preferensi Anda

Pilih perpustakaan yang tepat untuk kebutuhan Anda. Jelajahi API yang tersedia dan kemampuannya untuk memilih solusi yang paling efisien.

Keserbagunaan

Python via .NET

Pengembangan, keterbacaan, dan pemeliharaan kode yang mudah
Menawarkan fitur terbanyak dan menerima pembaruan yang paling sering
Kecepatan keseluruhan mungkin sedikit lebih lambat dari platform lainnya

Keseragaman

Python via Java

Gunakan pustaka yang sama di platform apa pun
Jalankan aplikasi Anda dengan mulus di perangkat apa pun
Membutuhkan Java Runtime Environment (JRE) versi 8 atau lebih baru

Pertunjukan

Python via C++

Kecepatan tercepat terlepas dari platform
Banyak kontrol atas manajemen sumber daya
Ditargetkan untuk pengembang yang berpengalaman

Berjalan di mana -mana

Terlepas dari namanya, Aspose.ocr untuk Python melalui .NET tidak mengharuskan .NET untuk diinstal pada platform target. Paket instalasi sudah dilengkapi dengan semua komponen yang diperlukan dan dapat beroperasi dengan mulus di platform apa pun - baik itu mesin lokal, server web, atau cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Format file yang didukung

Aspose.OCR for Python via .NET dapat bekerja dengan file Anda bisa mendapatkan dari pemindai atau kamera. Hasil pengakuan dapat disimpan, diimpor ke database, atau dianalisis secara real time.

Gambar

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Batch OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Hasil pengakuan

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalasi

Aspose.ocr untuk python via .net dikirimkan sebagai paket python dengan dependensi minimal atau sebagai file yang dapat diunduh atau [paket pypi](https:/pypi.org/project/ocaspose-pypose](https:/pypi.org/project/ocaspose](https:/pypi.org/project/ocaspose](https:/pypi.org/project/ocaspose](https:/pypi.orgyg/project/ocaspose](https:/pypi.orgeCt/ocroCaspose Mudah Instal ke dalam proyek Anda, dan Anda siap mengenali teks dalam 140+ bahasa dan menyimpan hasil pengakuan dalam berbagai format.

Minta lisensi uji coba untuk memulai pengembangan aplikasi OCR yang berfungsi penuh tanpa batasan.

OCR di bawah Python

Perpustakaan kami terintegrasi dengan mudah, memungkinkan aplikasi Python untuk berjalan dengan mulus di platform apa pun - desktop windows, Windows Server, MacOS, Linux, dan cloud.

140+ bahasa pengakuan

Perpustakaan Java OCR kami adalah solusi universal untuk pemrosesan dokumen, ekstraksi data, dan digitalisasi konten pada skala global. Dengan dukungan untuk sejumlah besar skrip menulis Eropa, Timur Tengah dan Asia, itu diadaptasi dengan baik untuk negara dan bisnis mana pun.

Aspose OCR untuk Java mengenali teks dalam dokumen multibahasa, seperti Cina/Inggris, Arab/Prancis, atau Cyrillic/Inggris. Bahasa berikut didukung:

  • ** Latin yang diperluas **: Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
  • ** Cyrillic ** Alfabet: Rusia, Ukraina, Kazakh, Bulgaria, termasuk teks Cixed Cyrillic/Inggris;
  • Arab, Persia, Urdu, termasuk teks yang dicampur dengan bahasa Inggris;
  • Bahasa Cina, Korea, Jepang, Devanagari, dan Dravida, termasuk Hindi, Tamil, Marathi, dan lainnya. Teks bahasa campuran juga didukung.

Filter pemrosesan yang kuat

Keakuratan dan keandalan pengenalan karakter optik sangat tergantung pada kualitas gambar asli. Aspose OCR untuk Python via .NET menawarkan sejumlah besar filter pemrosesan gambar otomatis dan manual yang meningkatkan gambar sebelum dikirim ke mesin OCR:

  • Putar gambar terbalik dan diputar secara otomatis.
  • Deteksi gambar terbalik dan ekstrak teks putih-ke-hitam.
  • Secara otomatis menghilangkan kotoran, bintik -bintik, goresan, silau, gradien yang tidak diinginkan, dan kebisingan lainnya.
  • Secara otomatis menyesuaikan kontras gambar.
  • Secara otomatis mewah, atau mengubah ukuran gambar secara manual.
  • Konversi gambar menjadi hitam dan putih atau skala abu -abu.
  • Temukan bidang gambar yang berpotensi bermasalah dan kembalikan informasi tentang jenis cacat dan koordinatnya.
  • Tingkatkan ketebalan karakter dalam suatu gambar.
  • Gambar berisik yang blur sambil melestarikan tepi surat.
  • Luruskan kelengkungan halaman dan perbaiki distorsi lensa kamera untuk foto halaman.

Dioptimalkan untuk jenis dokumen tertentu

Aspose OCR untuk Python via .NET menawarkan jaringan saraf yang terlatih khusus untuk mengekstrak teks dari jenis gambar tertentu dengan akurasi maksimum:

Pemeriksa ejaan bawaan

Meskipun Perpustakaan Python OCR kami memberikan akurasi pengakuan tinggi, cacat pencetakan, kotoran, atau font non-standar dapat menyebabkan karakter atau kata-kata tertentu diakui secara tidak benar. Untuk lebih meningkatkan hasil pengenalan, Anda dapat menyalakan pemeriksa ejaan, yang menemukan dan secara otomatis mengoreksi kesalahan ejaan berdasarkan bahasa pengenalan yang dipilih.

Jika teks yang diakui berisi terminologi khusus, singkatan, dan kata -kata lain yang tidak ada dalam kamus ejaan umum, Anda dapat memberikan daftar kata Anda sendiri.

Pengakuan batch

API Python OCR kami membebaskan Anda dari mengenali gambar satu per satu. Menggunakan berbagai metode pemrosesan batch untuk mengenali banyak gambar dalam satu panggilan:

  • Pengakuan file multi-halaman PDF, TIFF, dan DJVU.
  • Pengakuan semua file dalam folder.
  • Pengakuan semua file dalam arsip.
  • Pengakuan semua file dari daftar.

Belajar dengan sampel

OCR untuk Python menyediakan serangkaian contoh ditulis dalam python, memungkinkan Anda untuk dengan cepat berkenalan dengan fungsinya dan kemampuannya. Dapatkan wawasan untuk membuat solusi yang disesuaikan untuk memenuhi kebutuhan bisnis Python Anda.

Fitur dan kemampuan

Aspose.OCR for Python via .NET Aspose.ocr untuk python via .net memecahkan tugas Anda dengan cepat dan mudah.

Feature icon

Foto OCR

Ekstrak teks dari foto smartphone dengan akurasi level pemindaian.

Feature icon

PDF yang dapat dicari

Konversi pemindaian apa pun menjadi dokumen yang dapat dicari, dapat diindeks, dan dapat diedit.

Feature icon

Pengakuan url

Kenali gambar dari URL tanpa mengunduhnya secara lokal.

Feature icon

Pengakuan curah

Baca semua gambar dari dokumen, folder, dan arsip multi-halaman.

Feature icon

Semua font dan gaya

Identifikasi dan kenali teks di semua jenis huruf dan gaya populer.

Feature icon

Pengenalan fine-tune

Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.

Feature icon

Pemeriksa ejaan

Meningkatkan hasil dengan secara otomatis mengoreksi kata -kata yang salah eja.

Feature icon

Temukan teks dalam gambar

Cari teks atau ekspresi reguler dalam satu set gambar.

Feature icon

Bandingkan teks gambar

Bandingkan teks pada dua gambar, terlepas dari kasing dan tata letak.

Sampel kode Python

Selesaikan sampel kode untuk mengintegrasikan OCR dengan mulus ke dalam aplikasi Python Anda.

Instalasi

Didistribusikan sebagai roda ular python atau paket yang dapat diunduh mandiri, Aspose.ocr untuk Python via .NET mudah didistribusikan. Integrasi ke dalam proyek Python Anda, langsung dari lingkungan pengembangan terintegrasi Python (IDE) yang Anda sukai, adalah proses yang mulus. Cukup instal, dan Anda siap untuk memanfaatkan jangkauan lengkap kemampuan OCR, menghemat hasil pengakuan dalam berbagai format.

pasca-instalasi, Anda dapat segera mulai menggunakan aspose.ocr untuk python melalui .net, meskipun dengan batasan tertentu. Lisensi sementara mengangkat semua pembatasan versi percobaan selama 30 hari. Memanfaatkan periode ini untuk memulai pengembangan aplikasi OCR yang berfungsi penuh, yang memungkinkan Anda membuat keputusan berdasarkan informasi tentang pembelian aspose.ocr untuk python melalui .net pada tahap selanjutnya.

Memuat lisensi

lic = License()
lic.set_license(self.licPath)

Kenali teks di foto

Membaca teks dari konten apa pun dalam Aspose OCR untuk Python semudah memanggil metode pengakuan universal.

Konversi foto menjadi teks - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python Universal Converter

API kami dengan mahir membaca gambar apa pun dari pemindai, kamera, atau smartphone: dokumen PDF, JPEG, PNG, TIFF, GIF, gambar BMP, dan bahkan file DJVU. Dukungan penuh untuk dokumen PDF multi-halaman, TIFF, dan gambar DJVU memastikan keserbagunaan. Anda juga dapat memberikan gambar dari web melalui URL.

Hasil pengakuan dikembalikan dalam format dokumen dan pertukaran data populer: teks biasa, PDF, Microsoft Word, Microsoft Excel, JSON, dan XML.

Kenali PDF dan simpan hasil untuk berbagai format output - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optimalisasi Sumber Daya di Python

Pengenalan karakter optik menuntut sumber daya. API kami menawarkan cara fleksibel untuk menyeimbangkan triad berkualitas waktu klasik:

  • Pilih antara pengakuan menyeluruh dan pengakuan cepat.
  • Tentukan jumlah utas yang dialokasikan untuk pengakuan, atau memungkinkan perpustakaan untuk secara otomatis mengukur jumlah inti prosesor.
  • Bebaskan CPU dengan membongkar perhitungan ke backend .net.

Pengakuan Cepat - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Kenali satu baris

Jika gambar Anda sudah dipangkas ke satu baris teks, itu dapat dikenali dalam mode tercepat, tanpa koreksi otomatis, deteksi struktur konten, dan langkah-langkah yang memakan sumber daya lainnya. Ini dapat mempercepat OCR hingga 7 kali lebih cepat dari proses pengenalan normal.

Kenali satu baris teks pada gambar - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)