Mengapa Aspose.OCR for .NET?

Aspose.OCR for .NET adalah API yang kuat, ramah pengembang, dan hemat biaya untuk pengenalan karakter optik. Dalam waktu kurang dari 10 baris kode C# asli, Anda dapat membangun kemampuan OCR ke dalam solusi desktop .NET, aplikasi Web berbasis MVC, layanan cloud, dan fungsi Azure tanpa server. Ekstrak teks yang dapat dibaca mesin dari pindaian, foto, dan tangkapan layar, ubah halaman pindaian menjadi PDF yang dapat dicari dan diindeks, temukan dan bandingkan teks pada gambar yang berfokus pada tugas bisnis daripada matematika rumit, jaringan saraf, dan seluk-beluk teknis lainnya. Klik item di bawah untuk mempelajari lebih lanjut tentang fitur dan manfaat kami.

Illustration ocr

Aplikasi global

Kenali teks dalam skrip Latin, Sirilik, dan Asia, termasuk lebih dari 6.000 karakter Tiongkok dan Hindi.

Baca semuanya

Ambil teks dari file apa pun yang diperoleh melalui pemindai atau kamera, dan proses gambar langsung dari tautan web.

Hasil yang dapat diandalkan

Mencapai akurasi pengenalan tinggi untuk semua gambar, termasuk gambar yang tidak fokus, diputar, terdistorsi, dan berisik.

Pengenalan batch

Kenali secara massal semua gambar dari folder dan arsip; membaca dokumen PDF multi-halaman dan gambar TIFF.

Deteksi tata letak

Identifikasi dan kategorikan blok konten dalam gambar untuk memastikan urutan teks yang diekstrak dengan benar, apa pun tata letaknya.

Contoh kode langsung

Pengenalan karakter optik menjadi tugas yang sepele dan mudah dengan Aspose.OCR, bahkan bagi pengembang yang baru mengenal teknologi ini. Beberapa baris kode saja sudah cukup untuk mengekstrak teks dari gambar dan menampilkannya di layar. Sesederhana itu - cobalah.

Siap mengenali Siap mengenali Letakkan file di sini atau klik untuk menelusuri *

* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Syarat Penggunaan Dan Kebijakan pribadi.

Hasil pengakuan
 

Ubah gambar menjadi teks

Lebih banyak contoh >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Independensi platform

Aspose.OCR for .NET dapat bekerja di platform apa pun yang mendukung .NET, .NET Core, atau .NET Framework - baik di lokal mesin, di server web, atau di cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Format file yang didukung

Aspose.OCR for .NET dapat bekerja dengan hampir semua file Anda bisa mendapatkannya dari pemindai atau kamera. Hasil pengenalan dikembalikan dalam format file dan pertukaran data terpopuler yang dapat disimpan, diimpor ke database, atau dianalisis secara real time.

Gambar-gambar

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Kumpulan OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Hasil pengakuan

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Cocok untuk konten apa pun

Keakuratan dan keandalan pengenalan teks sangat bergantung pada kualitas gambar aslinya. Aspose.OCR for .NET menyediakan beragam filter pemrosesan gambar otomatis dan manual yang menyempurnakan gambar sebelum dikirim ke mesin OCR.

Pemrosesan gambar yang canggih dan algoritme deteksi struktur konten yang dapat disesuaikan memungkinkan ekstraksi teks dari hampir semua gambar, mulai dari pindaian berkualitas tinggi hingga foto jalanan. Beberapa filter pemrosesan dapat diterapkan pada gambar yang sama untuk mendapatkan kualitas pengenalan terbaik.

Optimalisasi sumber daya

Aspose.OCR for .NET memungkinkan penyeimbangan kecepatan pengenalan, kualitas, dan pemanfaatan sumber daya yang sangat fleksibel untuk setiap kasus penggunaan spesifik:

  • Pilih antara pengenalan menyeluruh dan pengenalan cepat.
  • Tentukan jumlah thread yang dialokasikan untuk pengenalan, atau izinkan perpustakaan untuk secara otomatis menskalakan ke jumlah inti prosesor.
  • Kosongkan CPU dengan memindahkan perhitungan ke GPU.

130+ bahasa pengenalan

Aspose.OCR for .NET adalah solusi universal untuk pemrosesan dokumen, ekstraksi data, dan digitalisasi konten dalam skala global. Dengan dukungan untuk beragam skrip penulisan Eropa, Timur Tengah dan Asia, skrip ini dapat disesuaikan dengan baik untuk skala apa pun, melayani usaha kecil dan menengah serta perusahaan multinasional.

Anda dapat mendelegasikan deteksi bahasa ke perpustakaan atau menentukan bahasa secara manual, sehingga meningkatkan kinerja dan keandalan pengenalan. Bahasa berikut ini didukung:

  • Alfabet Latin yang Diperluas: Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
  • Alfabet Sirilik: Rusia, Ukraina, Kazakh, Serbia, Belarusia, Bulgaria;
  • Arab, Persia, Urdu;
  • Aksara Cina dan Dewanagari, termasuk Hindi, Marathi, Bhojpuri, dan lain-lain.

Fitur dan kemampuan

Aspose.OCR for .NET secara otomatis mengekstrak teks dari foto atau gambar yang dipindai, sehingga tidak perlu mengetik ulang dokumen secara manual.

Feature icon

Foto OCR

Ekstrak teks dari foto ponsel cerdas dengan akurasi tingkat pemindaian.

Feature icon

PDF yang dapat dicari

Ubah pindaian apa pun menjadi dokumen yang sepenuhnya dapat dicari dan diindeks.

Feature icon

Pengenalan URL

Kenali gambar dari URL tanpa mengunduhnya secara lokal.

Feature icon

Pengakuan massal

Baca semua gambar dari dokumen multi-halaman, folder, dan arsip.

Feature icon

Font dan gaya apa pun

Identifikasi dan kenali teks dalam semua tipografi dan gaya populer.

Feature icon

Sempurnakan pengenalan

Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.

Feature icon

Pemeriksa ejaan

Tingkatkan hasil dengan mengoreksi kata yang salah eja secara otomatis.

Feature icon

Temukan teks dalam gambar

Telusuri teks atau ekspresi reguler dalam kumpulan gambar.

Feature icon

Bandingkan teks gambar

Bandingkan teks pada dua gambar, apa pun kasus dan tata letaknya.

Mudah digunakan

Anda hanya memerlukan beberapa baris kode untuk mengubah gambar menjadi teks, membuat PDF yang dapat dicari, menyimpan hasil pengenalan ke dokumen, dan masih banyak lagi. Jelajahi contoh kode untuk memahami cara mengintegrasikan Aspose.OCR for .NET ke dalam solusi Anda.

Instalasi

Aspose.OCR for .NET didistribusikan sebagai paket NuGet atau sebagai [file yang dapat diunduh]( https://releases.aspose.com/ ocr/net/) dengan ketergantungan minimal. Paket ini dapat ditambahkan ke proyek Anda langsung dari Microsoft Visual Studio. Cukup instal ke proyek Anda dan Anda siap mengekstrak teks dari gambar dan menyimpan hasil pengenalan dalam format apa pun yang didukung. Jika sistem Anda memiliki GPU berkemampuan CUDA, Anda dapat menggunakan mesin OCR yang dipercepat GPU untuk meningkatkan performa pengenalan secara signifikan.

Anda dapat mulai menggunakan Aspose.OCR for .NET segera setelah instalasi dengan beberapa pembatasan . Lisensi sementara menghilangkan semua batasan versi uji coba selama 30 hari. Gunakan untuk mulai membangun aplikasi OCR yang berfungsi penuh dan membuat keputusan akhir untuk membeli Aspose.OCR for .NET nanti.

Ekstrak teks dari foto

Ketika orang biasanya memikirkan OCR (Optical Character Recognition), asosiasi pertama sering kali dikaitkan dengan pemindai sebagai perangkat penangkapan utama. Asosiasi ini memiliki alasan historis dan masih lazim dalam banyak konteks, menyediakan lingkungan yang konsisten dan terkendali untuk menangkap teks cetak dari dokumen fisik dengan kualitas tak tertandingi. Namun, pemindai adalah peralatan khusus yang tidak selalu tersedia dan memerlukan stasiun kerja stasioner untuk beroperasi. Untungnya, dunia modern menyediakan alternatif yang nyaman untuk pemindai tradisional - kamera ponsel pintar. Kemajuan dalam teknologi kamera ponsel cerdas memastikan bahwa ponsel cerdas tingkat pemula sekalipun memberikan kualitas yang memadai untuk menangkap dokumen yang siap OCR. Dan memori internal membuatnya lebih mudah untuk mendigitalkan dokumen, surat kabar, buku, rambu jalan, dan teks lainnya dalam jumlah besar saat bepergian. Yang Anda butuhkan hanyalah teknologi yang tepat untuk mengubah foto-foto tersebut menjadi teks yang dapat dibaca mesin.

Aspose.OCR for .NET dirancang khusus untuk mengenali semua jenis gambar langsung dan dapat disesuaikan lebih lanjut untuk menangani foto berkualitas rendah sekalipun. Dikombinasikan dengan smartphone modern, ini memungkinkan Anda membuat aplikasi OCR yang kuat untuk sebagian besar tugas pemindaian dan pengenalan teks sehari-hari. Pemrosesan gambar paling canggih dan analisis struktur dokumen dilakukan dalam beberapa baris kode, memungkinkan Anda fokus pada bisnis daripada algoritma matematika yang rumit, jaringan saraf, dan seluk-beluk teknis lainnya.

Foto OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Buat PDF yang dapat dicari dari pindaian

PDF adalah salah satu format paling populer untuk memindai dokumen kertas, terutama karena kemampuannya menggabungkan beberapa halaman menjadi satu file. Format ini banyak digunakan untuk pertukaran kontrak, faktur, dokumen hukum, paspor dan kartu identitas, dan banyak dokumen lainnya antara individu, bisnis, bank, dan lembaga pemerintah. Namun, setiap PDF yang dipindai pada dasarnya adalah kumpulan gambar. Itu tidak berisi teks yang dapat dibaca mesin, sehingga pengguna tidak dapat mencari, menyalin, atau memanipulasi konten dokumen.

Aspose.OCR for .NET menawarkan cara yang cepat, mudah, dan sangat andal untuk mengonversi PDF yang dipindai menjadi dokumen yang dapat dicari dan diindeks sepenuhnya. Ini secara akurat mengenali konten halaman, mengubahnya menjadi lapisan teks yang dapat dibaca mesin di atas gambar asli yang dapat dipilih, disalin, dibaca oleh perangkat lunak text-to-speech, dan bahkan secara otomatis diproses oleh penerjemah, peringkas, dan analitik bertenaga AI lainnya peralatan.

Tambahkan hamparan teks ke PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Cari teks dalam gambar

Arsip digital, terutama di organisasi besar, sering kali terdiri dari banyak koleksi pindaian dan foto, banyak di antaranya mungkin berisi dokumen multi-halaman. Pengelolaan dan pengorganisasian arsip yang efisien dan efektif sangat penting untuk kemudahan penelusuran dan navigasi informasi. Namun, gambar tidak berisi teks yang dapat dibaca mesin, sehingga pencarian dan analisis konten dokumen tidak mungkin dilakukan.

Aspose.OCR for .NET memungkinkan Anda mencari teks dalam gambar dengan mudah, apa pun font, ukuran teks, gaya, dan parameter lainnya. Pustaka ini juga mendukung penelusuran peka huruf besar-kecil dan ekspresi reguler, yang sangat berguna dalam berbagai aplikasi dan industri. Fungsi ini dapat digunakan untuk mengkategorikan dokumen berdasarkan konten, kata kunci, atau pola yang ditemukan dalam teks; mencari istilah atau klausul tertentu dalam perjanjian dan kontrak; mengatur ulang file berdasarkan kata kunci atau konten yang ditemukan di dalamnya; menemukan dan mengidentifikasi data pribadi dalam dokumen, sehingga memudahkan untuk memastikan kepatuhan GDPR dan mengelola informasi sensitif dengan lebih efektif. Pencarian dalam gambar juga memungkinkan pembuatan alur kerja otomatis dan menyederhanakan berbagai proses bisnis setelah menerima kontrak dan faktur yang ditandatangani.

Mencari teks dalam gambar - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}