Natywne API OCR dla aplikacji .NET
Konwertuj obraz na tekst w C#
Więcej wystaw >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Dlaczego Aspose.OCR for .NET?
Aspose.OCR for .NET to solidny, przyjazny dla programistów i ekonomiczny interfejs API do optycznego rozpoznawania znaków. Za pomocą mniej niż 10 wierszy natywnego kodu C# możesz wbudować funkcje OCR w rozwiązania komputerowe .NET, aplikacje internetowe oparte na MVC, usługi w chmurze i bezserwerowe funkcje platformy Azure. Wyodrębniaj tekst do odczytu maszynowego ze skanów, zdjęć i zrzutów ekranu, konwertuj zeskanowane strony do plików PDF z możliwością przeszukiwania i indeksowania, znajduj i porównuj tekst na obrazach skupiając się na zadaniach biznesowych, a nie na skomplikowanej matematyce, sieciach neuronowych i innych zawiłościach technicznych. Kliknij poniższe elementy, aby dowiedzieć się więcej o naszych funkcjach i korzyściach.
Aplikacje globalne
Rozpoznaje teksty zapisane łaciną, cyrylicą i alfabetem azjatyckim, w tym ponad 6000 znaków chińskich i hindi.
Przeczytaj wszystko
Odzyskaj tekst z dowolnego pliku uzyskanego za pomocą skanera lub aparatu i przetwarzaj obrazy bezpośrednio z łączy internetowych.
Wiarygodne wyniki
Uzyskaj wysoką dokładność rozpoznawania wszystkich obrazów, w tym tych nieostrych, obróconych, zniekształconych i zaszumionych.
Rozpoznawanie partii
Masowe rozpoznawanie wszystkich obrazów z folderów i archiwów; czytaj wielostronicowe dokumenty PDF i obrazy TIFF.
Wykrywanie układu
Identyfikuj i kategoryzuj bloki treści na obrazach, aby zapewnić prawidłową kolejność wyodrębnionego tekstu, niezależnie od układu.
Próbka kodu na żywo
Optyczne rozpoznawanie znaków staje się trywialnym i prostym zadaniem dzięki Aspose.OCR, nawet dla programistów, którzy są nowicjuszami w tej technologii. Wystarczy kilka linii kodu, aby wyodrębnić tekst z obrazu i wyświetlić go na ekranie. To naprawdę takie proste – spróbuj.
* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki korzystania I Polityka prywatności.
Konwertuj obraz na tekst
Więcej przykładów >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Niezależność platformy
Aspose.OCR for .NET może działać na dowolnej platformie , która obsługuje .NET, .NET Core lub .NET Framework – niezależnie od tego, czy jest to lokalny komputerze, na serwerze WWW lub w chmurze.
Obsługiwane formaty plików
Aspose.OCR for .NET może pracować z praktycznie każdym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania zwracane są w najpopularniejszych formatach plików i wymiany danych, które można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.
Obrazy
- JPEG
- PNG
- TIFF
- BMP
- GIF
Partia OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Wyniki uznania
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Nadaje się do dowolnej treści
Dokładność i niezawodność rozpoznawania tekstu w dużym stopniu zależy od jakości oryginalnego obrazu. Aspose.OCR for .NET zapewnia szeroką gamę w pełni zautomatyzowanych i ręcznych filtrów przetwarzania obrazu, które poprawiają obraz przed wysłaniem go do silnika OCR.
Zaawansowane przetwarzanie obrazu i konfigurowalne algorytmy wykrywania struktury treści umożliwiają wyodrębnianie tekstu z praktycznie dowolnego obrazu, od wysokiej jakości skanów po zdjęcia uliczne. Aby uzyskać najlepszą jakość rozpoznawania, do tego samego obrazu można zastosować wiele filtrów przetwarzania.
Optymalizacja zasobów
Aspose.OCR for .NET umożliwia wysoce elastyczne równoważenie szybkości rozpoznawania, jakości i wykorzystania zasobów dla każdego konkretnego przypadku użycia:
- Wybierz pomiędzy dokładnym rozpoznaniem a szybkim rozpoznaniem.
- Określ liczbę wątków przydzielonych do rozpoznawania lub zezwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
- Uwolnij procesor, przenosząc obliczenia na procesor graficzny.
Ponad 130 języków rozpoznawania
Aspose.OCR for .NET to uniwersalne rozwiązanie do przetwarzania dokumentów, ekstrakcji danych i digitalizacji treści na skalę globalną. Dzięki obsłudze szerokiej gamy skryptów pisarskich z Europy, Bliskiego Wschodu i Azji jest dobrze dostosowany do dowolnej skali, obsługując zarówno małe i średnie firmy, jak i międzynarodowe korporacje.
Możesz delegować wykrywanie języka do biblioteki lub ręcznie określić język, zwiększając wydajność i niezawodność rozpoznawania. Obsługiwane są następujące języki:
- Rozszerzony alfabet łaciński: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i ponad 80 innych;
- Cyrylica alfabet: rosyjski, ukraiński, kazachski, serbski, białoruski, bułgarski;
- arabski, perski, urdu;
- Pismo chińskie i dewanagari, w tym hindi, marathi, bhojpuri i inne.
Funkcje i możliwości
Aspose.OCR for .NET automatycznie wyodrębnia tekst ze zdjęć lub zeskanowanych obrazów, eliminując potrzebę ręcznego przepisywania dokumentów.
Zdjęcie OCR
Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.
Przeszukiwalny plik PDF
Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania i indeksowania.
Rozpoznawanie adresu URL
Rozpoznaj obraz z adresu URL bez konieczności pobierania go lokalnie.
Rozpoznawanie zbiorcze
Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.
Dowolna czcionka i styl
Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.
Dostosuj rozpoznawanie
Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.
Sprawdzanie pisowni
Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.
Znajdź tekst na obrazach
Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.
Porównaj teksty obrazów
Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.
Łatwy w użyciu
Potrzebujesz tylko kilku linii kodu, aby przekonwertować obraz na tekst, utworzyć plik PDF z możliwością przeszukiwania, zapisać wyniki rozpoznawania w dokumencie i wiele więcej. Zapoznaj się z przykładami kodu, aby zrozumieć, jak zintegrować Aspose.OCR for .NET ze swoimi rozwiązaniami.
Instalacja
Możesz rozpocząć korzystanie z Aspose.OCR for .NET zaraz po instalacji z pewnymi ograniczeniami . Licencja tymczasowa usuwa wszystkie ograniczenia wersji próbnej na 30 dni. Użyj go, aby rozpocząć budowę w pełni funkcjonalnej aplikacji OCR i podjąć ostateczną decyzję o zakupie Aspose.OCR for .NET później.
Wyodrębnij tekst ze zdjęcia
Kiedy ludzie zwykle myślą o OCR (optycznym rozpoznawaniu znaków), pierwszym skojarzeniem jest często skaner jako główne urządzenie przechwytujące. To powiązanie ma przyczyny historyczne i jest nadal powszechne w wielu kontekstach, zapewniając spójne i kontrolowane środowisko do przechwytywania drukowanego tekstu z dokumentów fizycznych o niezrównanej jakości. Skaner to jednak sprzęt specjalistyczny, który nie zawsze jest pod ręką i wymaga do obsługi stacjonarnego stanowiska pracy. Na szczęście współczesny świat zapewnia wygodną alternatywę dla tradycyjnych skanerów – aparat w smartfonie. Postęp w technologii aparatów w smartfonach gwarantuje, że nawet podstawowy smartfon zapewnia jakość wystarczającą do przechwytywania dokumentów gotowych do OCR. Wbudowana pamięć sprawia, że digitalizacja dużych ilości dokumentów, gazet, książek, znaków drogowych i innego tekstu w drodze staje się łatwiejsza niż kiedykolwiek. Wystarczy odpowiednia technologia, aby przekonwertować te zdjęcia na tekst nadający się do odczytu maszynowego.
Aspose.OCR for .NET jest specjalnie zaprojektowany do rozpoznawania wszystkich typów obrazów od razu po wyjęciu z pudełka i może być dodatkowo dostrojony, aby poradzić sobie nawet ze zdjęciami o niskiej jakości. W połączeniu z nowoczesnym smartfonem umożliwia tworzenie wydajnych aplikacji OCR do większości codziennych zadań skanowania i rozpoznawania tekstu. Najbardziej zaawansowane przetwarzanie obrazu i analiza struktury dokumentu przeprowadzane są w kilku linijkach kodu, co pozwala skupić się na biznesie, a nie na skomplikowanych algorytmach matematycznych, sieciach neuronowych i innych zawiłościach technicznych.
OCR zdjęć — C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Utwórz ze skanu plik PDF z możliwością przeszukiwania
PDF to jeden z najpopularniejszych formatów skanowania dokumentów papierowych, szczególnie ze względu na możliwość łączenia wielu stron w jeden plik. Format ten jest szeroko stosowany do wymiany umów, faktur, dokumentów prawnych, paszportów i dowodów osobistych oraz wielu innych dokumentów pomiędzy osobami fizycznymi, firmami, bankami i agencjami rządowymi. Jednak każdy zeskanowany plik PDF jest w zasadzie zbiorem obrazów. Nie zawiera tekstu nadającego się do odczytu maszynowego, więc użytkownicy nie mogą przeszukiwać, kopiować ani w żaden inny sposób manipulować zawartością dokumentu.
Aspose.OCR for .NET oferuje szybki, łatwy i wysoce niezawodny sposób konwersji dowolnego zeskanowanego pliku PDF na dokument z możliwością pełnego przeszukiwania i indeksowania. Dokładnie rozpoznaje zawartość strony, przekształcając ją w czytelną maszynowo warstwę tekstową na oryginalnym obrazie, którą można wybrać, skopiować, odczytać za pomocą oprogramowania zamieniającego tekst na mowę, a nawet automatycznie przetworzyć przez tłumaczy, podsumowujących i inne narzędzia analityczne oparte na sztucznej inteligencji narzędzia.
Dodaj nakładkę tekstową do pliku PDF — C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Szukaj tekstu na obrazach
Archiwa cyfrowe, szczególnie w dużych organizacjach, często składają się z ogromnej kolekcji skanów i zdjęć, z których wiele może zawierać wielostronicowe dokumenty. Efektywne zarządzanie i skuteczna organizacja takich archiwów jest niezbędna do łatwego wyszukiwania informacji i nawigacji. Obrazy nie zawierają jednak tekstu nadającego się do odczytu maszynowego, co uniemożliwia wyszukiwanie i analizowanie treści dokumentów.
Aspose.OCR for .NET umożliwia łatwe wyszukiwanie tekstu w obrazach, niezależnie od czcionki, rozmiaru tekstu, stylu i innych parametrów. Biblioteka obsługuje także wyszukiwania bez uwzględniania wielkości liter i wyrażenia regularne, które są niezwykle przydatne w różnych zastosowaniach i branżach. Funkcjonalności tej można używać do kategoryzowania dokumentów na podstawie treści, słów kluczowych lub wzorców występujących w tekście; wyszukiwanie konkretnych terminów lub klauzul w ramach umów i kontraktów; reorganizacja plików w oparciu o słowa kluczowe lub znajdującą się w nich treść; lokalizować i identyfikować dane osobowe w dokumentach, ułatwiając zapewnienie zgodności z RODO i skuteczniejsze zarządzanie informacjami wrażliwymi. Wyszukiwanie za pomocą obrazów pozwala także na tworzenie zautomatyzowanych przepływów pracy i usprawnianie różnych procesów biznesowych po otrzymaniu podpisanych umów i faktur.
Wyszukaj tekst w obrazach — C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}