Dlaczego warto wybrać bibliotekę Aspose OCR?

W ciągu kilku sekund wbuduj zaawansowane możliwości OCR w swoje aplikacje .NET. Nasz łatwy w obsłudze interfejs API OCR umożliwia wyodrębnianie tekstu z obrazów i skanów, tworzenie plików PDF z możliwością przeszukiwania i nie tylko przy minimalnej liczbie kodu C#. Idealny do zastosowań desktopowych, internetowych, chmurowych i bezserwerowych .NET. Kliknij poniższe elementy, aby dowiedzieć się więcej o naszych funkcjach i korzyściach.

Illustration ocr

Globalne aplikacje OCR

C# OCR rozpoznaje teksty w języku angielskim, cyrylicy, arabskim, perskim, chińskim, japońskim, koreańskim, hindi, tamilskim i w językach mieszanych.

Przeczytaj wszystko

Uzyskaj tekst z dowolnego pliku uzyskanego za pomocą skanera lub aparatu i przetwarzaj obrazy bezpośrednio z łączy internetowych.

Wiarygodne wyniki

Uzyskaj wysoką dokładność rozpoznawania wszystkich obrazów, łącznie z tymi, które są nieostre, obrócone, zniekształcone i zaszumione.

Rozpoznawanie partii

Masowe rozpoznawanie wszystkich obrazów z folderów i archiwów; czytaj wielostronicowe dokumenty PDF i obrazy TIFF.

Wykrywanie układu

Identyfikuj i kategoryzuj bloki treści na obrazach, aby zapewnić prawidłową kolejność wyodrębnionego tekstu, niezależnie od układu.

Próbka kodu na żywo

.NET OCR staje się trywialnym i prostym zadaniem dzięki Aspose OCR API, nawet dla nowych programistów. Wystarczy kilka linii kodu, aby wyodrębnić tekst z obrazu i wyświetlić go na ekranie. To naprawdę takie proste – spróbuj.

Gotowy do rozpoznania Gotowy do rozpoznania Upuść plik tutaj lub kliknij, aby przeglądać *

* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki użytkowania I Polityka prywatności.

Wynik uznania
 

Konwertuj obraz na tekst

Więcej przykładów >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Niezależność platformy

Wieloplatformowa biblioteka OCR może działać wszędzie w środowisku .NET, .NET Core lub .NET Framework – czy to na komputerze lokalnym, czy na komputerze serwerze WWW lub w chmurze.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Obsługiwane formaty plików

Aspose.OCR for .NET może pracować z dowolnym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.

Obrazy

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Partia OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Wyniki uznania

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Nadaje się do dowolnej treści

Dokładność i niezawodność rozpoznawania tekstu w języku C# zależy w dużej mierze od jakości obrazu. .NET OCR oferuje pełny zestaw automatycznej i ręcznej optymalizacji obrazu, zapewniając doskonałe wyniki rozpoznawania.

Zaawansowane przetwarzanie obrazu, w pełni konfigurowalne wykrywanie tekstu, przetwarzanie końcowe i automatyczna korekta pisowni umożliwiają wyodrębnianie tekstu z dowolnego skanu lub zdjęcia z najwyższą dokładnością.

Optymalizacja zasobów OCR

Biblioteka Aspose C# OCR umożliwia bardzo elastyczne równoważenie szybkości rozpoznawania, jakości i wykorzystania zasobów dla każdego konkretnego przypadku użycia:

  • Wybierz pomiędzy dokładnym rozpoznaniem a szybkim rozpoznaniem.
  • Określ liczbę wątków przeznaczonych do rozpoznawania lub pozwól naszej bibliotece .NET OCR na automatyczne skalowanie do liczby rdzeni procesora.
  • Uwolnij procesor, przenosząc obliczenia na procesor graficzny.

Ponad 140 języków rozpoznawania

Nasza biblioteka C# OCR to uniwersalne rozwiązanie do przetwarzania dokumentów, ekstrakcji danych i digitalizacji treści na skalę globalną. Dzięki obsłudze szerokiej gamy skryptów pisarskich z Europy, Bliskiego Wschodu i Azji jest dobrze dostosowany do każdego kraju i firmy.

Można rozpoznawać dokumenty napisane w językach mieszanych, takich jak chiński/angielski, arabski/francuski lub cyrylica/angielski. Obsługiwane są następujące języki:

  • Rozszerzona łacina: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i ponad 80 innych;
  • Cyrylica alfabet: rosyjski, ukraiński, kazachski, bułgarski, w tym teksty mieszane cyrylicy i języka angielskiego;
  • arabski, perski, urdu, w tym teksty zmieszane z angielskim;
  • Języki chiński, koreański, japoński, dewanagari i dravidyjski, w tym hindi, tamilski, marathi i inne.

Funkcje i możliwości

C# OCR automatycznie wyodrębnia tekst ze zdjęć lub skanów, eliminując potrzebę ręcznego przepisywania dokumentów.

Feature icon

Zdjęcie OCR

Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.

Feature icon

Przeszukiwalny plik PDF

Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania i indeksowania.

Feature icon

Rozpoznawanie adresu URL

Rozpoznaj obraz z adresu URL bez konieczności pobierania go lokalnie.

Feature icon

Rozpoznawanie zbiorcze

Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.

Feature icon

Dowolna czcionka i styl

Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.

Feature icon

Dostosuj rozpoznawanie

Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.

Feature icon

Sprawdzanie pisowni

Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.

Feature icon

Znajdź tekst na obrazach

Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.

Feature icon

Porównaj teksty obrazkowe

Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.

Łatwy w użyciu OCR

Dzięki naszemu interfejsowi API OCR w języku C# potrzebujesz tylko kilku linijek kodu C#, aby przekonwertować obraz na tekst, utworzyć plik PDF z możliwością przeszukiwania, zapisać wyniki rozpoznawania w dokumencie i wiele więcej. Zapoznaj się z przykładami kodu, aby zrozumieć, jak zintegrować nasze API OCR z rozwiązaniami .NET.

Instalacja

.NET OCR jest dystrybuowany jako pakiet NuGet lub jako [plik do pobrania]( https://releases.aspose.com/ocr/net /) z minimalnymi zależnościami. Pakiet można dodać do projektu bezpośrednio z Microsoft Visual Studio. Po prostu zainstaluj go w swoim projekcie i możesz wyodrębnić tekst z obrazów i zapisać wyniki rozpoznawania w dowolnym obsługiwanym formacie. Jeśli Twój system jest wyposażony w procesor graficzny obsługujący CUDA, możesz użyć akcelerowanego przez GPU silnika OCR , aby znacznie zwiększyć wydajność rozpoznawania.

Możesz rozpocząć korzystanie z Aspose.OCR for .NET zaraz po instalacji z pewnymi ograniczeniami . Licencja tymczasowa usuwa wszystkie ograniczenia wersji próbnej na 30 dni. Użyj go, aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR i później podjąć ostateczną decyzję o zakupie OCR dla .NET.

Wyodrębnij tekst ze zdjęcia

Kiedy ludzie zwykle myślą o OCR (optycznym rozpoznawaniu znaków), pierwszym skojarzeniem jest często skaner jako główne urządzenie przechwytujące. To powiązanie ma przyczyny historyczne i jest nadal powszechne w wielu kontekstach, zapewniając spójne i kontrolowane środowisko do przechwytywania drukowanego tekstu z dokumentów fizycznych o niezrównanej jakości. Skaner to jednak sprzęt specjalistyczny, który nie zawsze jest pod ręką i wymaga do obsługi stacjonarnego stanowiska pracy. Na szczęście współczesny świat zapewnia wygodną alternatywę dla tradycyjnych skanerów – aparat w smartfonie. Postęp w technologii aparatów w smartfonach gwarantuje, że nawet podstawowy smartfon zapewnia jakość wystarczającą do przechwytywania dokumentów gotowych do OCR. Wbudowana pamięć sprawia, że ​​digitalizacja dużych ilości dokumentów, gazet, książek, znaków drogowych i innego tekstu w drodze staje się łatwiejsza niż kiedykolwiek. Wystarczy odpowiednia technologia, aby przekonwertować te zdjęcia na tekst nadający się do odczytu maszynowego.

Nasza biblioteka C# OCR została specjalnie zaprojektowana do rozpoznawania wszystkich typów obrazów od razu po wyjęciu z pudełka i może być dodatkowo dostrojona, aby obsługiwać nawet zdjęcia o niskiej jakości. W połączeniu z nowoczesnym smartfonem umożliwia tworzenie wydajnych aplikacji OCR do większości codziennych zadań skanowania i rozpoznawania tekstu. Najbardziej zaawansowane przetwarzanie obrazu i analiza struktury dokumentu przeprowadzane są w kilku linijkach kodu, co pozwala skupić się na biznesie, a nie na skomplikowanych algorytmach matematycznych, sieciach neuronowych i innych zawiłościach technicznych.

OCR zdjęć — C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Utwórz ze skanu plik PDF z możliwością przeszukiwania

PDF to jeden z najpopularniejszych formatów skanowania dokumentów papierowych, szczególnie ze względu na możliwość łączenia wielu stron w jeden plik. Format ten jest szeroko stosowany do wymiany umów, faktur, dokumentów prawnych, paszportów i dowodów osobistych oraz wielu innych dokumentów pomiędzy osobami fizycznymi, firmami, bankami i agencjami rządowymi. Jednak każdy zeskanowany plik PDF jest w zasadzie zbiorem obrazów. Nie zawiera tekstu nadającego się do odczytu maszynowego, więc użytkownicy nie mogą przeszukiwać, kopiować ani w żaden inny sposób manipulować zawartością dokumentu.

Aspose .NET OCR oferuje szybki, łatwy i wysoce niezawodny sposób konwersji dowolnego zeskanowanego pliku PDF na dokument z możliwością pełnego przeszukiwania i indeksowania. Dokładnie rozpoznaje zawartość strony, przekształcając ją w czytelną maszynowo warstwę tekstową na oryginalnym obrazie, którą można wybrać, skopiować, odczytać za pomocą oprogramowania zamieniającego tekst na mowę, a nawet automatycznie przetworzyć przez tłumaczy, podsumowujących i inne narzędzia analityczne oparte na sztucznej inteligencji narzędzia.

Dodaj nakładkę tekstową do pliku PDF — C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Szukaj tekstu na obrazach

Archiwa cyfrowe, szczególnie w dużych organizacjach, często składają się z ogromnej kolekcji skanów i zdjęć, z których wiele może zawierać wielostronicowe dokumenty. Efektywne zarządzanie i skuteczna organizacja takich archiwów jest niezbędna do łatwego wyszukiwania informacji i nawigacji. Obrazy nie zawierają jednak tekstu nadającego się do odczytu maszynowego, co uniemożliwia wyszukiwanie i analizowanie treści dokumentów.

Biblioteka C# OCR umożliwia łatwe wyszukiwanie tekstu w obrazach, niezależnie od czcionki, rozmiaru tekstu, stylu i innych parametrów. Biblioteka obsługuje także wyszukiwania bez uwzględniania wielkości liter i wyrażenia regularne, które są niezwykle przydatne w różnych zastosowaniach i branżach. Funkcjonalności tej można używać do kategoryzowania dokumentów na podstawie treści, słów kluczowych lub wzorców występujących w tekście; wyszukiwanie konkretnych terminów lub klauzul w ramach umów i kontraktów; reorganizacja plików w oparciu o słowa kluczowe lub znajdującą się w nich treść; lokalizować i identyfikować dane osobowe w dokumentach, ułatwiając zapewnienie zgodności z RODO i skuteczniejsze zarządzanie informacjami wrażliwymi. Wyszukiwanie za pomocą obrazów pozwala także na tworzenie zautomatyzowanych przepływów pracy i usprawnianie różnych procesów biznesowych po otrzymaniu podpisanych umów i faktur.

Wyszukaj tekst w obrazach — C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}