Dlaczego Aspose.OCR for .NET?

Aspose.OCR for .NET to solidny, przyjazny dla programistów i ekonomiczny interfejs API do optycznego rozpoznawania znaków. Za pomocą mniej niż 10 wierszy natywnego kodu C# możesz wbudować funkcje OCR w rozwiązania komputerowe .NET, aplikacje internetowe oparte na MVC, usługi w chmurze i bezserwerowe funkcje platformy Azure. Wyodrębniaj tekst do odczytu maszynowego ze skanów, zdjęć i zrzutów ekranu, konwertuj zeskanowane strony do plików PDF z możliwością przeszukiwania i indeksowania, znajduj i porównuj tekst na obrazach skupiając się na zadaniach biznesowych, a nie na skomplikowanej matematyce, sieciach neuronowych i innych zawiłościach technicznych. Kliknij poniższe elementy, aby dowiedzieć się więcej o naszych funkcjach i korzyściach.

Illustration ocr

Aplikacje globalne

Rozpoznaje teksty zapisane łaciną, cyrylicą i alfabetem azjatyckim, w tym ponad 6000 znaków chińskich i hindi.

Przeczytaj wszystko

Odzyskaj tekst z dowolnego pliku uzyskanego za pomocą skanera lub aparatu i przetwarzaj obrazy bezpośrednio z łączy internetowych.

Wiarygodne wyniki

Uzyskaj wysoką dokładność rozpoznawania wszystkich obrazów, w tym tych nieostrych, obróconych, zniekształconych i zaszumionych.

Rozpoznawanie partii

Masowe rozpoznawanie wszystkich obrazów z folderów i archiwów; czytaj wielostronicowe dokumenty PDF i obrazy TIFF.

Wykrywanie układu

Identyfikuj i kategoryzuj bloki treści na obrazach, aby zapewnić prawidłową kolejność wyodrębnionego tekstu, niezależnie od układu.

Próbka kodu na żywo

Optyczne rozpoznawanie znaków staje się trywialnym i prostym zadaniem dzięki Aspose.OCR, nawet dla programistów, którzy są nowicjuszami w tej technologii. Wystarczy kilka linii kodu, aby wyodrębnić tekst z obrazu i wyświetlić go na ekranie. To naprawdę takie proste – spróbuj.

Gotowy do rozpoznania Gotowy do rozpoznania Upuść plik tutaj lub kliknij, aby przeglądać *

* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki korzystania I Polityka prywatności.

Wynik uznania
 

Konwertuj obraz na tekst

Więcej przykładów >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Niezależność platformy

Aspose.OCR for .NET może działać na dowolnej platformie , która obsługuje .NET, .NET Core lub .NET Framework – niezależnie od tego, czy jest to lokalny komputerze, na serwerze WWW lub w chmurze.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Obsługiwane formaty plików

Aspose.OCR for .NET może pracować z praktycznie każdym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania zwracane są w najpopularniejszych formatach plików i wymiany danych, które można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.

Obrazy

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Partia OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Wyniki uznania

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Nadaje się do dowolnej treści

Dokładność i niezawodność rozpoznawania tekstu w dużym stopniu zależy od jakości oryginalnego obrazu. Aspose.OCR for .NET zapewnia szeroką gamę w pełni zautomatyzowanych i ręcznych filtrów przetwarzania obrazu, które poprawiają obraz przed wysłaniem go do silnika OCR.

Zaawansowane przetwarzanie obrazu i konfigurowalne algorytmy wykrywania struktury treści umożliwiają wyodrębnianie tekstu z praktycznie dowolnego obrazu, od wysokiej jakości skanów po zdjęcia uliczne. Aby uzyskać najlepszą jakość rozpoznawania, do tego samego obrazu można zastosować wiele filtrów przetwarzania.

Optymalizacja zasobów

Aspose.OCR for .NET umożliwia wysoce elastyczne równoważenie szybkości rozpoznawania, jakości i wykorzystania zasobów dla każdego konkretnego przypadku użycia:

  • Wybierz pomiędzy dokładnym rozpoznaniem a szybkim rozpoznaniem.
  • Określ liczbę wątków przydzielonych do rozpoznawania lub zezwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
  • Uwolnij procesor, przenosząc obliczenia na procesor graficzny.

Ponad 130 języków rozpoznawania

Aspose.OCR for .NET to uniwersalne rozwiązanie do przetwarzania dokumentów, ekstrakcji danych i digitalizacji treści na skalę globalną. Dzięki obsłudze szerokiej gamy skryptów pisarskich z Europy, Bliskiego Wschodu i Azji jest dobrze dostosowany do dowolnej skali, obsługując zarówno małe i średnie firmy, jak i międzynarodowe korporacje.

Możesz delegować wykrywanie języka do biblioteki lub ręcznie określić język, zwiększając wydajność i niezawodność rozpoznawania. Obsługiwane są następujące języki:

  • Rozszerzony alfabet łaciński: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i ponad 80 innych;
  • Cyrylica alfabet: rosyjski, ukraiński, kazachski, serbski, białoruski, bułgarski;
  • arabski, perski, urdu;
  • Pismo chińskie i dewanagari, w tym hindi, marathi, bhojpuri i inne.

Funkcje i możliwości

Aspose.OCR for .NET automatycznie wyodrębnia tekst ze zdjęć lub zeskanowanych obrazów, eliminując potrzebę ręcznego przepisywania dokumentów.

Feature icon

Zdjęcie OCR

Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.

Feature icon

Przeszukiwalny plik PDF

Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania i indeksowania.

Feature icon

Rozpoznawanie adresu URL

Rozpoznaj obraz z adresu URL bez konieczności pobierania go lokalnie.

Feature icon

Rozpoznawanie zbiorcze

Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.

Feature icon

Dowolna czcionka i styl

Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.

Feature icon

Dostosuj rozpoznawanie

Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.

Feature icon

Sprawdzanie pisowni

Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.

Feature icon

Znajdź tekst na obrazach

Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.

Feature icon

Porównaj teksty obrazów

Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.

Łatwy w użyciu

Potrzebujesz tylko kilku linii kodu, aby przekonwertować obraz na tekst, utworzyć plik PDF z możliwością przeszukiwania, zapisać wyniki rozpoznawania w dokumencie i wiele więcej. Zapoznaj się z przykładami kodu, aby zrozumieć, jak zintegrować Aspose.OCR for .NET ze swoimi rozwiązaniami.

Instalacja

Aspose.OCR for .NET jest dystrybuowany jako pakiet NuGet lub jako [plik do pobrania]( https://releases.aspose.com/ ocr/net/) z minimalnymi zależnościami. Pakiet można dodać do projektu bezpośrednio z Microsoft Visual Studio. Po prostu zainstaluj go w swoim projekcie i możesz wyodrębnić tekst z obrazów i zapisać wyniki rozpoznawania w dowolnym obsługiwanym formacie. Jeśli Twój system jest wyposażony w procesor graficzny obsługujący CUDA, możesz użyć akcelerowanego przez GPU silnika OCR , aby znacznie zwiększyć wydajność rozpoznawania.

Możesz rozpocząć korzystanie z Aspose.OCR for .NET zaraz po instalacji z pewnymi ograniczeniami . Licencja tymczasowa usuwa wszystkie ograniczenia wersji próbnej na 30 dni. Użyj go, aby rozpocząć budowę w pełni funkcjonalnej aplikacji OCR i podjąć ostateczną decyzję o zakupie Aspose.OCR for .NET później.

Wyodrębnij tekst ze zdjęcia

Kiedy ludzie zwykle myślą o OCR (optycznym rozpoznawaniu znaków), pierwszym skojarzeniem jest często skaner jako główne urządzenie przechwytujące. To powiązanie ma przyczyny historyczne i jest nadal powszechne w wielu kontekstach, zapewniając spójne i kontrolowane środowisko do przechwytywania drukowanego tekstu z dokumentów fizycznych o niezrównanej jakości. Skaner to jednak sprzęt specjalistyczny, który nie zawsze jest pod ręką i wymaga do obsługi stacjonarnego stanowiska pracy. Na szczęście współczesny świat zapewnia wygodną alternatywę dla tradycyjnych skanerów – aparat w smartfonie. Postęp w technologii aparatów w smartfonach gwarantuje, że nawet podstawowy smartfon zapewnia jakość wystarczającą do przechwytywania dokumentów gotowych do OCR. Wbudowana pamięć sprawia, że ​​digitalizacja dużych ilości dokumentów, gazet, książek, znaków drogowych i innego tekstu w drodze staje się łatwiejsza niż kiedykolwiek. Wystarczy odpowiednia technologia, aby przekonwertować te zdjęcia na tekst nadający się do odczytu maszynowego.

Aspose.OCR for .NET jest specjalnie zaprojektowany do rozpoznawania wszystkich typów obrazów od razu po wyjęciu z pudełka i może być dodatkowo dostrojony, aby poradzić sobie nawet ze zdjęciami o niskiej jakości. W połączeniu z nowoczesnym smartfonem umożliwia tworzenie wydajnych aplikacji OCR do większości codziennych zadań skanowania i rozpoznawania tekstu. Najbardziej zaawansowane przetwarzanie obrazu i analiza struktury dokumentu przeprowadzane są w kilku linijkach kodu, co pozwala skupić się na biznesie, a nie na skomplikowanych algorytmach matematycznych, sieciach neuronowych i innych zawiłościach technicznych.

OCR zdjęć — C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Utwórz ze skanu plik PDF z możliwością przeszukiwania

PDF to jeden z najpopularniejszych formatów skanowania dokumentów papierowych, szczególnie ze względu na możliwość łączenia wielu stron w jeden plik. Format ten jest szeroko stosowany do wymiany umów, faktur, dokumentów prawnych, paszportów i dowodów osobistych oraz wielu innych dokumentów pomiędzy osobami fizycznymi, firmami, bankami i agencjami rządowymi. Jednak każdy zeskanowany plik PDF jest w zasadzie zbiorem obrazów. Nie zawiera tekstu nadającego się do odczytu maszynowego, więc użytkownicy nie mogą przeszukiwać, kopiować ani w żaden inny sposób manipulować zawartością dokumentu.

Aspose.OCR for .NET oferuje szybki, łatwy i wysoce niezawodny sposób konwersji dowolnego zeskanowanego pliku PDF na dokument z możliwością pełnego przeszukiwania i indeksowania. Dokładnie rozpoznaje zawartość strony, przekształcając ją w czytelną maszynowo warstwę tekstową na oryginalnym obrazie, którą można wybrać, skopiować, odczytać za pomocą oprogramowania zamieniającego tekst na mowę, a nawet automatycznie przetworzyć przez tłumaczy, podsumowujących i inne narzędzia analityczne oparte na sztucznej inteligencji narzędzia.

Dodaj nakładkę tekstową do pliku PDF — C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Szukaj tekstu na obrazach

Archiwa cyfrowe, szczególnie w dużych organizacjach, często składają się z ogromnej kolekcji skanów i zdjęć, z których wiele może zawierać wielostronicowe dokumenty. Efektywne zarządzanie i skuteczna organizacja takich archiwów jest niezbędna do łatwego wyszukiwania informacji i nawigacji. Obrazy nie zawierają jednak tekstu nadającego się do odczytu maszynowego, co uniemożliwia wyszukiwanie i analizowanie treści dokumentów.

Aspose.OCR for .NET umożliwia łatwe wyszukiwanie tekstu w obrazach, niezależnie od czcionki, rozmiaru tekstu, stylu i innych parametrów. Biblioteka obsługuje także wyszukiwania bez uwzględniania wielkości liter i wyrażenia regularne, które są niezwykle przydatne w różnych zastosowaniach i branżach. Funkcjonalności tej można używać do kategoryzowania dokumentów na podstawie treści, słów kluczowych lub wzorców występujących w tekście; wyszukiwanie konkretnych terminów lub klauzul w ramach umów i kontraktów; reorganizacja plików w oparciu o słowa kluczowe lub znajdującą się w nich treść; lokalizować i identyfikować dane osobowe w dokumentach, ułatwiając zapewnienie zgodności z RODO i skuteczniejsze zarządzanie informacjami wrażliwymi. Wyszukiwanie za pomocą obrazów pozwala także na tworzenie zautomatyzowanych przepływów pracy i usprawnianie różnych procesów biznesowych po otrzymaniu podpisanych umów i faktur.

Wyszukaj tekst w obrazach — C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}