Mengapa memilih perpustakaan Aspose OCR?

Bangun kemampuan OCR yang kuat ke dalam aplikasi .NET Anda dalam hitungan detik. OCR API kami yang mudah digunakan memungkinkan Anda mengekstrak teks dari gambar dan pindaian, membuat PDF yang dapat dicari, dan banyak lagi dengan kode C# minimal. Ideal untuk fungsi desktop .NET, web, cloud, dan tanpa server. Klik item di bawah untuk mempelajari lebih lanjut tentang fitur dan manfaat kami.

Illustration ocr

Aplikasi OCR global

C# OCR mengenali teks berbahasa Inggris, Sirilik, Arab, Persia, Cina, Jepang, Korea, Hindi, Tamil, dan bahasa campuran.

Baca semuanya

Dapatkan teks dari file apa pun yang diperoleh melalui pemindai atau kamera, dan proses gambar langsung dari tautan web.

Hasil yang dapat diandalkan

Mencapai akurasi pengenalan tinggi untuk semua gambar, termasuk gambar yang tidak fokus, diputar, terdistorsi, dan berisik.

Pengenalan batch

Kenali secara massal semua gambar dari folder dan arsip; membaca dokumen PDF multi-halaman dan gambar TIFF.

Deteksi tata letak

Identifikasi dan kategorikan blok konten dalam gambar untuk memastikan urutan teks yang diekstrak dengan benar, apa pun tata letaknya.

Contoh kode langsung

.NET OCR menjadi tugas yang sepele dan mudah dengan Aspose OCR API, bahkan untuk pengembang baru. Beberapa baris kode saja sudah cukup untuk mengekstrak teks dari gambar dan menampilkannya di layar. Sesederhana itu - cobalah.

Siap mengenali Siap mengenali Letakkan file di sini atau klik untuk menelusuri *

* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Ketentuan penggunaan Dan Kebijakan Privasi.

Hasil pengakuan
 

Ubah gambar menjadi teks

Lebih banyak contoh >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Independensi platform

Pustaka OCR lintas platform dapat berfungsi di mana saja di bawah .NET, .NET Core, atau .NET Framework - baik di mesin lokal, di komputer server web, atau di cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Format file yang didukung

Aspose.OCR for .NET dapat bekerja dengan [file]apa pun( https://docs.aspose.com/ocr/net/supported-file-formats/ ) Anda bisa mendapatkannya dari pemindai atau kamera. Hasil pengenalan dapat disimpan, diimpor ke database, atau dianalisis secara real time.

Gambar

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Kumpulan OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Hasil pengakuan

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Cocok untuk konten apa pun

Keakuratan dan keandalan pengenalan teks di C# sangat bergantung pada kualitas gambar. .NET OCR menawarkan serangkaian pengoptimalan gambar otomatis dan manual, memastikan hasil pengenalan yang unggul.

Pemrosesan gambar yang canggih, deteksi teks yang dapat disesuaikan sepenuhnya, pasca-pemrosesan, dan koreksi ejaan otomatis memungkinkan ekstraksi teks dari pemindaian atau foto apa pun dengan akurasi tertinggi.

Optimalisasi sumber daya OCR

Pustaka C# OCR Aspose memungkinkan keseimbangan yang sangat fleksibel antara kecepatan pengenalan, kualitas, dan pemanfaatan sumber daya untuk setiap kasus penggunaan spesifik:

  • Pilih antara pengenalan menyeluruh dan pengenalan cepat.
  • Tentukan jumlah thread yang dialokasikan untuk pengenalan, atau izinkan perpustakaan .NET OCR kami untuk secara otomatis menskalakan jumlah inti prosesor.
  • Kosongkan CPU dengan memindahkan perhitungan ke GPU.

140+ bahasa pengenalan

Pustaka C# OCR kami adalah solusi universal untuk pemrosesan dokumen, ekstraksi data, dan digitalisasi konten dalam skala global. Dengan dukungan untuk beragam skrip penulisan Eropa, Timur Tengah, dan Asia, skrip ini dapat disesuaikan dengan baik untuk negara dan bisnis mana pun.

Anda dapat mengenali dokumen yang ditulis dalam bahasa campuran, seperti Cina/Inggris, Arab/Prancis, atau Sirilik/Inggris. Bahasa berikut ini didukung:

  • Latin Diperluas: Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
  • Alfabet Sirilik: Rusia, Ukraina, Kazakh, Bulgaria, termasuk teks campuran Sirilik/Inggris;
  • Arab, Persia, Urdu, termasuk teks bercampur dengan bahasa Inggris;
  • Bahasa Cina, Korea, Jepang, Dewanagari, dan Dravida, termasuk Hindi, Tamil, Marathi, dan lain-lain.

Fitur dan kemampuan

C# OCR secara otomatis mengekstrak teks dari foto atau pindaian, sehingga tidak perlu mengetik ulang dokumen secara manual.

Feature icon

Foto OCR

Ekstrak teks dari foto ponsel cerdas dengan akurasi tingkat pemindaian.

Feature icon

PDF yang dapat dicari

Ubah pindaian apa pun menjadi dokumen yang sepenuhnya dapat dicari dan diindeks.

Feature icon

Pengenalan URL

Kenali gambar dari URL tanpa mengunduhnya secara lokal.

Feature icon

Pengakuan massal

Baca semua gambar dari dokumen multi-halaman, folder, dan arsip.

Feature icon

Font dan gaya apa pun

Identifikasi dan kenali teks dalam semua tipografi dan gaya populer.

Feature icon

Sempurnakan pengenalan

Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.

Feature icon

Pemeriksa ejaan

Tingkatkan hasil dengan mengoreksi kata yang salah eja secara otomatis.

Feature icon

Temukan teks dalam gambar

Telusuri teks atau ekspresi reguler dalam kumpulan gambar.

Feature icon

Bandingkan teks gambar

Bandingkan teks pada dua gambar, apa pun kasus dan tata letaknya.

OCR yang mudah digunakan

Dengan C# OCR API kami, Anda hanya memerlukan beberapa baris kode C# untuk mengubah gambar menjadi teks, membuat PDF yang dapat dicari, menyimpan hasil pengenalan ke dokumen, dan masih banyak lagi. Jelajahi contoh kode untuk memahami cara mengintegrasikan OCR API kami ke dalam solusi .NET Anda.

Instalasi

.NET OCR didistribusikan sebagai paket NuGet atau sebagai [file yang dapat diunduh]( https://releases.aspose.com/ocr/net /) dengan ketergantungan minimal. Paket ini dapat ditambahkan ke proyek Anda langsung dari Microsoft Visual Studio. Cukup instal ke proyek Anda dan Anda siap mengekstrak teks dari gambar dan menyimpan hasil pengenalan dalam format apa pun yang didukung. Jika sistem Anda memiliki GPU berkemampuan CUDA, Anda dapat menggunakan mesin OCR yang dipercepat GPU untuk meningkatkan performa pengenalan secara signifikan.

Anda dapat mulai menggunakan Aspose.OCR for .NET segera setelah instalasi dengan beberapa pembatasan . Lisensi sementara menghilangkan semua batasan versi uji coba selama 30 hari. Gunakan ini untuk mulai membangun aplikasi OCR yang berfungsi penuh dan membuat keputusan akhir untuk membeli OCR untuk .NET nanti.

Ekstrak teks dari foto

Ketika orang biasanya memikirkan OCR (Optical Character Recognition), asosiasi pertama sering kali dikaitkan dengan pemindai sebagai perangkat penangkapan utama. Asosiasi ini memiliki alasan historis dan masih lazim dalam banyak konteks, menyediakan lingkungan yang konsisten dan terkendali untuk menangkap teks cetak dari dokumen fisik dengan kualitas tak tertandingi. Namun, pemindai adalah peralatan khusus yang tidak selalu tersedia dan memerlukan stasiun kerja stasioner untuk beroperasi. Untungnya, dunia modern menyediakan alternatif yang nyaman untuk pemindai tradisional - kamera ponsel pintar. Kemajuan dalam teknologi kamera ponsel cerdas memastikan bahwa ponsel cerdas tingkat pemula sekalipun memberikan kualitas yang memadai untuk menangkap dokumen yang siap OCR. Dan memori internal membuatnya lebih mudah untuk mendigitalkan dokumen, surat kabar, buku, rambu jalan, dan teks lainnya dalam jumlah besar saat bepergian. Yang Anda butuhkan hanyalah teknologi yang tepat untuk mengubah foto-foto tersebut menjadi teks yang dapat dibaca mesin.

Pustaka C# OCR kami dirancang khusus untuk mengenali semua jenis gambar langsung dan dapat disesuaikan lebih lanjut untuk menangani foto berkualitas rendah sekalipun. Dikombinasikan dengan smartphone modern, ini memungkinkan Anda membuat aplikasi OCR yang kuat untuk sebagian besar tugas pemindaian dan pengenalan teks sehari-hari. Pemrosesan gambar paling canggih dan analisis struktur dokumen dilakukan dalam beberapa baris kode, memungkinkan Anda fokus pada bisnis daripada algoritma matematika yang rumit, jaringan saraf, dan seluk-beluk teknis lainnya.

Foto OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Buat PDF yang dapat dicari dari pindaian

PDF adalah salah satu format paling populer untuk memindai dokumen kertas, terutama karena kemampuannya menggabungkan beberapa halaman menjadi satu file. Format ini banyak digunakan untuk pertukaran kontrak, faktur, dokumen hukum, paspor dan kartu identitas, dan banyak dokumen lainnya antara individu, bisnis, bank, dan lembaga pemerintah. Namun, setiap PDF yang dipindai pada dasarnya adalah kumpulan gambar. Itu tidak berisi teks yang dapat dibaca mesin, sehingga pengguna tidak dapat mencari, menyalin, atau memanipulasi konten dokumen.

Asumsikan .NET OCR menawarkan cara yang cepat, mudah, dan sangat andal untuk mengonversi PDF yang dipindai menjadi dokumen yang dapat dicari dan diindeks sepenuhnya. Ini secara akurat mengenali konten halaman, mengubahnya menjadi lapisan teks yang dapat dibaca mesin di atas gambar asli yang dapat dipilih, disalin, dibaca oleh perangkat lunak text-to-speech, dan bahkan secara otomatis diproses oleh penerjemah, peringkas, dan analitik bertenaga AI lainnya peralatan.

Tambahkan hamparan teks ke PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Cari teks dalam gambar

Arsip digital, terutama di organisasi besar, sering kali terdiri dari banyak koleksi pindaian dan foto, banyak di antaranya mungkin berisi dokumen multi-halaman. Pengelolaan dan pengorganisasian arsip yang efisien dan efektif sangat penting untuk kemudahan penelusuran dan navigasi informasi. Namun, gambar tidak berisi teks yang dapat dibaca mesin, sehingga pencarian dan analisis konten dokumen tidak mungkin dilakukan.

Pustaka C# OCR memungkinkan Anda mencari teks dalam gambar dengan mudah, apa pun font, ukuran teks, gaya, dan parameter lainnya. Pustaka ini juga mendukung penelusuran peka huruf besar-kecil dan ekspresi reguler, yang sangat berguna dalam berbagai aplikasi dan industri. Fungsi ini dapat digunakan untuk mengkategorikan dokumen berdasarkan konten, kata kunci, atau pola yang ditemukan dalam teks; mencari istilah atau klausul tertentu dalam perjanjian dan kontrak; mengatur ulang file berdasarkan kata kunci atau konten yang ditemukan di dalamnya; menemukan dan mengidentifikasi data pribadi dalam dokumen, sehingga memudahkan untuk memastikan kepatuhan GDPR dan mengelola informasi sensitif dengan lebih efektif. Pencarian dalam gambar juga memungkinkan pembuatan alur kerja otomatis dan menyederhanakan berbagai proses bisnis setelah menerima kontrak dan faktur yang ditandatangani.

Mencari teks dalam gambar - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}