Pustaka C# OCR untuk aplikasi .NET
Ubah gambar menjadi teks dalam C# OCR
Lebih banyak pameran >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Mengapa memilih perpustakaan Aspose OCR?
Bangun kemampuan OCR yang kuat ke dalam aplikasi .NET Anda dalam hitungan detik. OCR API kami yang mudah digunakan memungkinkan Anda mengekstrak teks dari gambar dan pindaian, membuat PDF yang dapat dicari, dan banyak lagi dengan kode C# minimal. Ideal untuk fungsi desktop .NET, web, cloud, dan tanpa server. Klik item di bawah untuk mempelajari lebih lanjut tentang fitur dan manfaat kami.
Aplikasi OCR global
C# OCR mengenali teks berbahasa Inggris, Sirilik, Arab, Persia, Cina, Jepang, Korea, Hindi, Tamil, dan bahasa campuran.
Baca semuanya
Dapatkan teks dari file apa pun yang diperoleh melalui pemindai atau kamera, dan proses gambar langsung dari tautan web.
Hasil yang dapat diandalkan
Mencapai akurasi pengenalan tinggi untuk semua gambar, termasuk gambar yang tidak fokus, diputar, terdistorsi, dan berisik.
Pengenalan batch
Kenali secara massal semua gambar dari folder dan arsip; membaca dokumen PDF multi-halaman dan gambar TIFF.
Deteksi tata letak
Identifikasi dan kategorikan blok konten dalam gambar untuk memastikan urutan teks yang diekstrak dengan benar, apa pun tata letaknya.
Contoh kode langsung
.NET OCR menjadi tugas yang sepele dan mudah dengan Aspose OCR API, bahkan untuk pengembang baru. Beberapa baris kode saja sudah cukup untuk mengekstrak teks dari gambar dan menampilkannya di layar. Sesederhana itu - cobalah.
* Dengan mengunggah file Anda atau menggunakan layanan yang Anda setujui dengan kami Ketentuan penggunaan Dan Kebijakan Privasi.
Ubah gambar menjadi teks
Lebih banyak contoh >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Independensi platform
Pustaka OCR lintas platform dapat berfungsi di mana saja di bawah .NET, .NET Core, atau .NET Framework - baik di mesin lokal, di komputer server web, atau di cloud.
Format file yang didukung
Aspose.OCR for .NET dapat bekerja dengan [file]apa pun( https://docs.aspose.com/ocr/net/supported-file-formats/ ) Anda bisa mendapatkannya dari pemindai atau kamera. Hasil pengenalan dapat disimpan, diimpor ke database, atau dianalisis secara real time.
Gambar
- JPEG
- PNG
- TIFF
- BMP
- GIF
Kumpulan OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Hasil pengakuan
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Cocok untuk konten apa pun
Keakuratan dan keandalan pengenalan teks di C# sangat bergantung pada kualitas gambar. .NET OCR menawarkan serangkaian pengoptimalan gambar otomatis dan manual, memastikan hasil pengenalan yang unggul.
Pemrosesan gambar yang canggih, deteksi teks yang dapat disesuaikan sepenuhnya, pasca-pemrosesan, dan koreksi ejaan otomatis memungkinkan ekstraksi teks dari pemindaian atau foto apa pun dengan akurasi tertinggi.
Optimalisasi sumber daya OCR
Pustaka C# OCR Aspose memungkinkan keseimbangan yang sangat fleksibel antara kecepatan pengenalan, kualitas, dan pemanfaatan sumber daya untuk setiap kasus penggunaan spesifik:
- Pilih antara pengenalan menyeluruh dan pengenalan cepat.
- Tentukan jumlah thread yang dialokasikan untuk pengenalan, atau izinkan perpustakaan .NET OCR kami untuk secara otomatis menskalakan jumlah inti prosesor.
- Kosongkan CPU dengan memindahkan perhitungan ke GPU.
140+ bahasa pengenalan
Pustaka C# OCR kami adalah solusi universal untuk pemrosesan dokumen, ekstraksi data, dan digitalisasi konten dalam skala global. Dengan dukungan untuk beragam skrip penulisan Eropa, Timur Tengah, dan Asia, skrip ini dapat disesuaikan dengan baik untuk negara dan bisnis mana pun.
Anda dapat mengenali dokumen yang ditulis dalam bahasa campuran, seperti Cina/Inggris, Arab/Prancis, atau Sirilik/Inggris. Bahasa berikut ini didukung:
- Latin Diperluas: Inggris, Spanyol, Prancis, Indonesia, Portugis, Jerman, Vietnam, Turki, Italia, Polandia, dan 80+ lainnya;
- Alfabet Sirilik: Rusia, Ukraina, Kazakh, Bulgaria, termasuk teks campuran Sirilik/Inggris;
- Arab, Persia, Urdu, termasuk teks bercampur dengan bahasa Inggris;
- Bahasa Cina, Korea, Jepang, Dewanagari, dan Dravida, termasuk Hindi, Tamil, Marathi, dan lain-lain.
Fitur dan kemampuan
C# OCR secara otomatis mengekstrak teks dari foto atau pindaian, sehingga tidak perlu mengetik ulang dokumen secara manual.
Foto OCR
Ekstrak teks dari foto ponsel cerdas dengan akurasi tingkat pemindaian.
PDF yang dapat dicari
Ubah pindaian apa pun menjadi dokumen yang sepenuhnya dapat dicari dan diindeks.
Pengenalan URL
Kenali gambar dari URL tanpa mengunduhnya secara lokal.
Pengakuan massal
Baca semua gambar dari dokumen multi-halaman, folder, dan arsip.
Font dan gaya apa pun
Identifikasi dan kenali teks dalam semua tipografi dan gaya populer.
Sempurnakan pengenalan
Sesuaikan setiap parameter OCR untuk hasil pengenalan terbaik.
Pemeriksa ejaan
Tingkatkan hasil dengan mengoreksi kata yang salah eja secara otomatis.
Temukan teks dalam gambar
Telusuri teks atau ekspresi reguler dalam kumpulan gambar.
Bandingkan teks gambar
Bandingkan teks pada dua gambar, apa pun kasus dan tata letaknya.
OCR yang mudah digunakan
Dengan C# OCR API kami, Anda hanya memerlukan beberapa baris kode C# untuk mengubah gambar menjadi teks, membuat PDF yang dapat dicari, menyimpan hasil pengenalan ke dokumen, dan masih banyak lagi. Jelajahi contoh kode untuk memahami cara mengintegrasikan OCR API kami ke dalam solusi .NET Anda.
Instalasi
Anda dapat mulai menggunakan Aspose.OCR for .NET segera setelah instalasi dengan beberapa pembatasan . Lisensi sementara menghilangkan semua batasan versi uji coba selama 30 hari. Gunakan ini untuk mulai membangun aplikasi OCR yang berfungsi penuh dan membuat keputusan akhir untuk membeli OCR untuk .NET nanti.
Ekstrak teks dari foto
Ketika orang biasanya memikirkan OCR (Optical Character Recognition), asosiasi pertama sering kali dikaitkan dengan pemindai sebagai perangkat penangkapan utama. Asosiasi ini memiliki alasan historis dan masih lazim dalam banyak konteks, menyediakan lingkungan yang konsisten dan terkendali untuk menangkap teks cetak dari dokumen fisik dengan kualitas tak tertandingi. Namun, pemindai adalah peralatan khusus yang tidak selalu tersedia dan memerlukan stasiun kerja stasioner untuk beroperasi. Untungnya, dunia modern menyediakan alternatif yang nyaman untuk pemindai tradisional - kamera ponsel pintar. Kemajuan dalam teknologi kamera ponsel cerdas memastikan bahwa ponsel cerdas tingkat pemula sekalipun memberikan kualitas yang memadai untuk menangkap dokumen yang siap OCR. Dan memori internal membuatnya lebih mudah untuk mendigitalkan dokumen, surat kabar, buku, rambu jalan, dan teks lainnya dalam jumlah besar saat bepergian. Yang Anda butuhkan hanyalah teknologi yang tepat untuk mengubah foto-foto tersebut menjadi teks yang dapat dibaca mesin.
Pustaka C# OCR kami dirancang khusus untuk mengenali semua jenis gambar langsung dan dapat disesuaikan lebih lanjut untuk menangani foto berkualitas rendah sekalipun. Dikombinasikan dengan smartphone modern, ini memungkinkan Anda membuat aplikasi OCR yang kuat untuk sebagian besar tugas pemindaian dan pengenalan teks sehari-hari. Pemrosesan gambar paling canggih dan analisis struktur dokumen dilakukan dalam beberapa baris kode, memungkinkan Anda fokus pada bisnis daripada algoritma matematika yang rumit, jaringan saraf, dan seluk-beluk teknis lainnya.
Foto OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Buat PDF yang dapat dicari dari pindaian
PDF adalah salah satu format paling populer untuk memindai dokumen kertas, terutama karena kemampuannya menggabungkan beberapa halaman menjadi satu file. Format ini banyak digunakan untuk pertukaran kontrak, faktur, dokumen hukum, paspor dan kartu identitas, dan banyak dokumen lainnya antara individu, bisnis, bank, dan lembaga pemerintah. Namun, setiap PDF yang dipindai pada dasarnya adalah kumpulan gambar. Itu tidak berisi teks yang dapat dibaca mesin, sehingga pengguna tidak dapat mencari, menyalin, atau memanipulasi konten dokumen.
Asumsikan .NET OCR menawarkan cara yang cepat, mudah, dan sangat andal untuk mengonversi PDF yang dipindai menjadi dokumen yang dapat dicari dan diindeks sepenuhnya. Ini secara akurat mengenali konten halaman, mengubahnya menjadi lapisan teks yang dapat dibaca mesin di atas gambar asli yang dapat dipilih, disalin, dibaca oleh perangkat lunak text-to-speech, dan bahkan secara otomatis diproses oleh penerjemah, peringkas, dan analitik bertenaga AI lainnya peralatan.
Tambahkan hamparan teks ke PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Cari teks dalam gambar
Arsip digital, terutama di organisasi besar, sering kali terdiri dari banyak koleksi pindaian dan foto, banyak di antaranya mungkin berisi dokumen multi-halaman. Pengelolaan dan pengorganisasian arsip yang efisien dan efektif sangat penting untuk kemudahan penelusuran dan navigasi informasi. Namun, gambar tidak berisi teks yang dapat dibaca mesin, sehingga pencarian dan analisis konten dokumen tidak mungkin dilakukan.
Pustaka C# OCR memungkinkan Anda mencari teks dalam gambar dengan mudah, apa pun font, ukuran teks, gaya, dan parameter lainnya. Pustaka ini juga mendukung penelusuran peka huruf besar-kecil dan ekspresi reguler, yang sangat berguna dalam berbagai aplikasi dan industri. Fungsi ini dapat digunakan untuk mengkategorikan dokumen berdasarkan konten, kata kunci, atau pola yang ditemukan dalam teks; mencari istilah atau klausul tertentu dalam perjanjian dan kontrak; mengatur ulang file berdasarkan kata kunci atau konten yang ditemukan di dalamnya; menemukan dan mengidentifikasi data pribadi dalam dokumen, sehingga memudahkan untuk memastikan kepatuhan GDPR dan mengelola informasi sensitif dengan lebih efektif. Pencarian dalam gambar juga memungkinkan pembuatan alur kerja otomatis dan menyederhanakan berbagai proses bisnis setelah menerima kontrak dan faktur yang ditandatangani.
Mencari teks dalam gambar - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}