Biblioteka C# OCR dla aplikacji .NET
Konwertuj obraz na tekst w C# OCR
Więcej wystaw >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Dlaczego warto wybrać bibliotekę Aspose OCR?
W ciągu kilku sekund wbuduj zaawansowane możliwości OCR w swoje aplikacje .NET. Nasz łatwy w obsłudze interfejs API OCR umożliwia wyodrębnianie tekstu z obrazów i skanów, tworzenie plików PDF z możliwością przeszukiwania i nie tylko przy minimalnej liczbie kodu C#. Idealny do zastosowań desktopowych, internetowych, chmurowych i bezserwerowych .NET. Kliknij poniższe elementy, aby dowiedzieć się więcej o naszych funkcjach i korzyściach.
Globalne aplikacje OCR
C# OCR rozpoznaje teksty w języku angielskim, cyrylicy, arabskim, perskim, chińskim, japońskim, koreańskim, hindi, tamilskim i w językach mieszanych.
Przeczytaj wszystko
Uzyskaj tekst z dowolnego pliku uzyskanego za pomocą skanera lub aparatu i przetwarzaj obrazy bezpośrednio z łączy internetowych.
Wiarygodne wyniki
Uzyskaj wysoką dokładność rozpoznawania wszystkich obrazów, łącznie z tymi, które są nieostre, obrócone, zniekształcone i zaszumione.
Rozpoznawanie partii
Masowe rozpoznawanie wszystkich obrazów z folderów i archiwów; czytaj wielostronicowe dokumenty PDF i obrazy TIFF.
Wykrywanie układu
Identyfikuj i kategoryzuj bloki treści na obrazach, aby zapewnić prawidłową kolejność wyodrębnionego tekstu, niezależnie od układu.
Próbka kodu na żywo
.NET OCR staje się trywialnym i prostym zadaniem dzięki Aspose OCR API, nawet dla nowych programistów. Wystarczy kilka linii kodu, aby wyodrębnić tekst z obrazu i wyświetlić go na ekranie. To naprawdę takie proste – spróbuj.
* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki użytkowania I Polityka prywatności.
Konwertuj obraz na tekst
Więcej przykładów >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Niezależność platformy
Wieloplatformowa biblioteka OCR może działać wszędzie w środowisku .NET, .NET Core lub .NET Framework – czy to na komputerze lokalnym, czy na komputerze serwerze WWW lub w chmurze.
Obsługiwane formaty plików
Aspose.OCR for .NET może pracować z dowolnym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.
Obrazy
- JPEG
- PNG
- TIFF
- BMP
- GIF
Partia OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Wyniki uznania
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Nadaje się do dowolnej treści
Dokładność i niezawodność rozpoznawania tekstu w języku C# zależy w dużej mierze od jakości obrazu. .NET OCR oferuje pełny zestaw automatycznej i ręcznej optymalizacji obrazu, zapewniając doskonałe wyniki rozpoznawania.
Zaawansowane przetwarzanie obrazu, w pełni konfigurowalne wykrywanie tekstu, przetwarzanie końcowe i automatyczna korekta pisowni umożliwiają wyodrębnianie tekstu z dowolnego skanu lub zdjęcia z najwyższą dokładnością.
Optymalizacja zasobów OCR
Biblioteka Aspose C# OCR umożliwia bardzo elastyczne równoważenie szybkości rozpoznawania, jakości i wykorzystania zasobów dla każdego konkretnego przypadku użycia:
- Wybierz pomiędzy dokładnym rozpoznaniem a szybkim rozpoznaniem.
- Określ liczbę wątków przeznaczonych do rozpoznawania lub pozwól naszej bibliotece .NET OCR na automatyczne skalowanie do liczby rdzeni procesora.
- Uwolnij procesor, przenosząc obliczenia na procesor graficzny.
Ponad 140 języków rozpoznawania
Nasza biblioteka C# OCR to uniwersalne rozwiązanie do przetwarzania dokumentów, ekstrakcji danych i digitalizacji treści na skalę globalną. Dzięki obsłudze szerokiej gamy skryptów pisarskich z Europy, Bliskiego Wschodu i Azji jest dobrze dostosowany do każdego kraju i firmy.
Można rozpoznawać dokumenty napisane w językach mieszanych, takich jak chiński/angielski, arabski/francuski lub cyrylica/angielski. Obsługiwane są następujące języki:
- Rozszerzona łacina: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i ponad 80 innych;
- Cyrylica alfabet: rosyjski, ukraiński, kazachski, bułgarski, w tym teksty mieszane cyrylicy i języka angielskiego;
- arabski, perski, urdu, w tym teksty zmieszane z angielskim;
- Języki chiński, koreański, japoński, dewanagari i dravidyjski, w tym hindi, tamilski, marathi i inne.
Funkcje i możliwości
C# OCR automatycznie wyodrębnia tekst ze zdjęć lub skanów, eliminując potrzebę ręcznego przepisywania dokumentów.
Zdjęcie OCR
Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.
Przeszukiwalny plik PDF
Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania i indeksowania.
Rozpoznawanie adresu URL
Rozpoznaj obraz z adresu URL bez konieczności pobierania go lokalnie.
Rozpoznawanie zbiorcze
Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.
Dowolna czcionka i styl
Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.
Dostosuj rozpoznawanie
Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.
Sprawdzanie pisowni
Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.
Znajdź tekst na obrazach
Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.
Porównaj teksty obrazkowe
Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.
Łatwy w użyciu OCR
Dzięki naszemu interfejsowi API OCR w języku C# potrzebujesz tylko kilku linijek kodu C#, aby przekonwertować obraz na tekst, utworzyć plik PDF z możliwością przeszukiwania, zapisać wyniki rozpoznawania w dokumencie i wiele więcej. Zapoznaj się z przykładami kodu, aby zrozumieć, jak zintegrować nasze API OCR z rozwiązaniami .NET.
Instalacja
Możesz rozpocząć korzystanie z Aspose.OCR for .NET zaraz po instalacji z pewnymi ograniczeniami . Licencja tymczasowa usuwa wszystkie ograniczenia wersji próbnej na 30 dni. Użyj go, aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR i później podjąć ostateczną decyzję o zakupie OCR dla .NET.
Wyodrębnij tekst ze zdjęcia
Kiedy ludzie zwykle myślą o OCR (optycznym rozpoznawaniu znaków), pierwszym skojarzeniem jest często skaner jako główne urządzenie przechwytujące. To powiązanie ma przyczyny historyczne i jest nadal powszechne w wielu kontekstach, zapewniając spójne i kontrolowane środowisko do przechwytywania drukowanego tekstu z dokumentów fizycznych o niezrównanej jakości. Skaner to jednak sprzęt specjalistyczny, który nie zawsze jest pod ręką i wymaga do obsługi stacjonarnego stanowiska pracy. Na szczęście współczesny świat zapewnia wygodną alternatywę dla tradycyjnych skanerów – aparat w smartfonie. Postęp w technologii aparatów w smartfonach gwarantuje, że nawet podstawowy smartfon zapewnia jakość wystarczającą do przechwytywania dokumentów gotowych do OCR. Wbudowana pamięć sprawia, że digitalizacja dużych ilości dokumentów, gazet, książek, znaków drogowych i innego tekstu w drodze staje się łatwiejsza niż kiedykolwiek. Wystarczy odpowiednia technologia, aby przekonwertować te zdjęcia na tekst nadający się do odczytu maszynowego.
Nasza biblioteka C# OCR została specjalnie zaprojektowana do rozpoznawania wszystkich typów obrazów od razu po wyjęciu z pudełka i może być dodatkowo dostrojona, aby obsługiwać nawet zdjęcia o niskiej jakości. W połączeniu z nowoczesnym smartfonem umożliwia tworzenie wydajnych aplikacji OCR do większości codziennych zadań skanowania i rozpoznawania tekstu. Najbardziej zaawansowane przetwarzanie obrazu i analiza struktury dokumentu przeprowadzane są w kilku linijkach kodu, co pozwala skupić się na biznesie, a nie na skomplikowanych algorytmach matematycznych, sieciach neuronowych i innych zawiłościach technicznych.
OCR zdjęć — C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Utwórz ze skanu plik PDF z możliwością przeszukiwania
PDF to jeden z najpopularniejszych formatów skanowania dokumentów papierowych, szczególnie ze względu na możliwość łączenia wielu stron w jeden plik. Format ten jest szeroko stosowany do wymiany umów, faktur, dokumentów prawnych, paszportów i dowodów osobistych oraz wielu innych dokumentów pomiędzy osobami fizycznymi, firmami, bankami i agencjami rządowymi. Jednak każdy zeskanowany plik PDF jest w zasadzie zbiorem obrazów. Nie zawiera tekstu nadającego się do odczytu maszynowego, więc użytkownicy nie mogą przeszukiwać, kopiować ani w żaden inny sposób manipulować zawartością dokumentu.
Aspose .NET OCR oferuje szybki, łatwy i wysoce niezawodny sposób konwersji dowolnego zeskanowanego pliku PDF na dokument z możliwością pełnego przeszukiwania i indeksowania. Dokładnie rozpoznaje zawartość strony, przekształcając ją w czytelną maszynowo warstwę tekstową na oryginalnym obrazie, którą można wybrać, skopiować, odczytać za pomocą oprogramowania zamieniającego tekst na mowę, a nawet automatycznie przetworzyć przez tłumaczy, podsumowujących i inne narzędzia analityczne oparte na sztucznej inteligencji narzędzia.
Dodaj nakładkę tekstową do pliku PDF — C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Szukaj tekstu na obrazach
Archiwa cyfrowe, szczególnie w dużych organizacjach, często składają się z ogromnej kolekcji skanów i zdjęć, z których wiele może zawierać wielostronicowe dokumenty. Efektywne zarządzanie i skuteczna organizacja takich archiwów jest niezbędna do łatwego wyszukiwania informacji i nawigacji. Obrazy nie zawierają jednak tekstu nadającego się do odczytu maszynowego, co uniemożliwia wyszukiwanie i analizowanie treści dokumentów.
Biblioteka C# OCR umożliwia łatwe wyszukiwanie tekstu w obrazach, niezależnie od czcionki, rozmiaru tekstu, stylu i innych parametrów. Biblioteka obsługuje także wyszukiwania bez uwzględniania wielkości liter i wyrażenia regularne, które są niezwykle przydatne w różnych zastosowaniach i branżach. Funkcjonalności tej można używać do kategoryzowania dokumentów na podstawie treści, słów kluczowych lub wzorców występujących w tekście; wyszukiwanie konkretnych terminów lub klauzul w ramach umów i kontraktów; reorganizacja plików w oparciu o słowa kluczowe lub znajdującą się w nich treść; lokalizować i identyfikować dane osobowe w dokumentach, ułatwiając zapewnienie zgodności z RODO i skuteczniejsze zarządzanie informacjami wrażliwymi. Wyszukiwanie za pomocą obrazów pozwala także na tworzenie zautomatyzowanych przepływów pracy i usprawnianie różnych procesów biznesowych po otrzymaniu podpisanych umów i faktur.
Wyszukaj tekst w obrazach — C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}