Aspose.OCR  for .NET

Konversikan gambar dan PDF ke teks dalam .NET

Tambahkan pengenalan karakter optik (OCR) ke aplikasi .NET Anda dengan beberapa baris kode.

  Download Free Trial
  
 

Aspose.OCR untuk .NET adalah API yang kuat namun mudah digunakan dan hemat biaya untuk pengenalan karakter optik. Dengannya, Anda dapat menambahkan fungsionalitas OCR ke aplikasi .NET Anda dalam waktu kurang dari 5 baris kode tanpa mengkhawatirkan matematika yang rumit, jaringan saraf, dan detail teknis lainnya. Pengalaman kami dalam teknologi pembelajaran mesin dan pengembangan selama bertahun-tahun menghasilkan mesin OCR dengan kecepatan dan akurasi superior yang mendukung 26 bahasa berdasarkan skrip Latin dan Sirilik serta Cina . OCR API dapat mengenali gambar yang dipindai, foto ponsel cerdas, tangkapan layar, area gambar, dan PDF yang dipindai dan mengembalikan hasil dalam format dokumen dan pertukaran data yang paling populer. Berbagai filter pra-pemrosesan memungkinkan Anda mengenali gambar yang diputar, miring, dan berisik. Kinerja pengenalan dan beban sistem dapat lebih ditingkatkan dengan mentransfer tugas komputasi intensif sumber daya ke GPU .

Fitur dan Kemampuan Aspose.OCR untuk .NET

Mengonversi gambar dan PDF menjadi teks

Mendukung semua format gambar yang bisa Anda dapatkan dari pemindai atau kamera

Membaca bahasa berdasarkan Latin dan Cyrillic

Mengenali lebih dari 6.000 karakter Cina

Mendeteksi dan mengenali semua tipografi populer

Dengan hati-hati mempertahankan gaya dan pemformatan font

Memproses seluruh gambar atau area yang dipilih saja

Mendukung gambar yang diputar, miring, dan berisik

Pengenalan batch semua gambar dalam folder atau arsip

Mengenali gambar yang disediakan sebagai tautan web

Menemukan dan secara otomatis mengoreksi kata-kata yang salah eja

Sepenuhnya kompatibel dengan produk Aspose lainnya

Mudah untuk Menginstal

Aspose.OCR untuk .NET didistribusikan sebagai paket NuGet ringan atau sebagai file yang dapat diunduh dengan ketergantungan minimal. Cukup instal ke proyek Anda dan Anda siap mengenali teks dalam bahasa apa pun yang didukung dan menyimpan hasil pengenalan dalam format apa pun yang didukung.

Minta lisensi sementara untuk mulai membangun aplikasi OCR yang berfungsi penuh tanpa batasan dan batasan apa pun.

Mudah digunakan

Anda memerlukan tiga baris kode untuk mengenali gambar dan menampilkan hasilnya. Ya, itu benar-benar sederhana!

Gambar ke teks dalam 3 baris - C#

// Inisialisasi mesin OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Kenali gambar ke teks
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Tampilkan hasil pengenalan
Console.WriteLine(result);

Lintas-Platform

Pustaka sepenuhnya mendukung .NET Standard 2.0. Artinya, aplikasi dapat berjalan di platform apa pun: desktop Windows, Windows Server, macOS, Linux, dan cloud.

26 Bahasa Pengenalan

OCR API dapat mengenali banyak bahasa dan semua skrip penulisan populer, termasuk teks dengan bahasa campuran.

  • Alfabet Latin yang Diperpanjang : Kroasia, Ceko, Denmark, Belanda, Inggris, Estonia, Finlandia, Prancis, Jerman, Italia, Latvia, Lituania, Norwegia, Polandia, Portugis, Rumania, Slovakia, Slovenia, Spanyol, Swedia.
  • Alfabet Sirilik : Belarusia, Bulgaria, Kazakh, Rusia, Serbia, Ukraina.
  • Cina : lebih dari 6.000 karakter.

Anda dapat menyerahkan deteksi bahasa ke perpustakaan atau menentukan bahasa sendiri untuk meningkatkan kinerja dan keandalan pengenalan.

Kenali Foto

Hambatan terbesar untuk aplikasi OCR adalah bahwa pemindai tidak biasa bagi pengguna akhir. API memiliki filter pra-pemrosesan gambar bawaan yang kuat yang dapat menangani gambar yang diputar, miring, dan berisik. Dikombinasikan dengan dukungan untuk semua format gambar, memungkinkan pengenalan yang andal bahkan untuk foto smartphone. Sebagian besar pra-pemrosesan dan koreksi gambar dilakukan secara otomatis, jadi Anda hanya perlu campur tangan dalam kasus-kasus sulit.

Terapkan koreksi gambar otomatis - C#

// Inisialisasi mesin OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Aktifkan perhitungan dan kontras kemiringan otomatis
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Kenali gambar
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Konverter universal

API dapat membaca gambar apa pun yang dapat Anda peroleh dari pemindai, kamera, atau ponsel cerdas: dokumen PDF, JPEG, PNG, TIFF, GIF, gambar BMP, dan bahkan file DjVu. Dokumen PDF multi-halaman, gambar TIFF dan DjVu didukung penuh. Anda juga dapat memberikan gambar dari web melalui URL.

Hasil pengenalan dikembalikan dalam format dokumen dan pertukaran data paling populer: teks biasa, PDF, Microsoft Word, Microsoft Excel, JSON, dan XML.

Kenali PDF dan simpan hasilnya ke JSON - C#

// Inisialisasi mesin OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Kenali semua halaman dari PDF yang dipindai
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Keluarkan setiap halaman sebagai JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Optimasi Sumber Daya

Pengenalan karakter optik adalah proses intensif sumber daya. API menawarkan cara yang sangat fleksibel untuk mencapai keseimbangan dalam triad klasik waktu-harga-kualitas:

  • Pilih antara pengenalan menyeluruh dan pengenalan cepat.
  • Tentukan jumlah utas yang dialokasikan untuk pengenalan, atau izinkan perpustakaan untuk secara otomatis menskalakan ke jumlah inti prosesor.
  • Kosongkan CPU dengan menurunkan perhitungan ke GPU.

Pengenalan cepat - C#

// Inisialisasi mesin OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Kenali gambar dalam mode tercepat
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Cek ejaan

Meskipun OCR memberikan hasil yang andal, debu dan cacat cetakan dapat menyebabkan beberapa simbol tidak dikenali dengan benar. OCR API memiliki pemeriksa ejaan bawaan yang secara otomatis mengganti kata yang salah eja dan membebaskan Anda dari keharusan mengoreksi hasil pengenalan secara manual.

Hasil pengenalan pemeriksaan ejaan - C#

// Inisialisasi mesin OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Aktifkan kontras otomatis
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Kenali gambar
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Perbaiki kata yang salah eja
string text =  result.GetSpellCheckCorrectedText();

Pemrosesan Batch

OCR API membebaskan Anda dari mengenali setiap gambar satu per satu dengan menawarkan berbagai metode pemrosesan batch yang memungkinkan Anda mengenali banyak gambar dalam satu panggilan:

  • Pengenalan file PDF, TIFF, dan DjVu multi-halaman.
  • Pengenalan semua file dalam folder.
  • Pengakuan semua file dalam arsip.
  • Pengakuan semua file dari daftar.

Belajar dengan Contoh

Aspose.OCR untuk .NET hadir dengan sejumlah contoh yang ditulis dalam C# yang memungkinkan Anda dengan cepat membiasakan diri dengan fungsi dan kemampuannya dan memberi Anda ide untuk menciptakan solusi untuk kebutuhan bisnis Anda.

  
  
  

Aspose juga menawarkan API OCR asli untuk bahasa pemrograman populer lainnya: