Aspose.OCR  for .NET

Konwertuj obrazy i pliki PDF na tekst w .NET

Dodaj optyczne rozpoznawanie znaków (OCR) do aplikacji .NET za pomocą kilku linijek kodu.

  Download Free Trial
  
 

Aspose.OCR for .NET to potężny, ale łatwy w użyciu i ekonomiczny interfejs API do optycznego rozpoznawania znaków. Dzięki niemu możesz dodać funkcję OCR do swoich aplikacji .NET w mniej niż 5 wierszach kodu, nie martwiąc się o złożoną matematykę, sieci neuronowe i inne szczegóły techniczne. Nasze doświadczenie w technologiach uczenia maszynowego i lata rozwoju zaowocowały silnikiem OCR o doskonałej szybkości i dokładności, który obsługuje 26 języków opartych na skryptach łacińskich i cyrylicy oraz chińskim . OCR API może rozpoznawać zeskanowane obrazy, zdjęcia smartfona, zrzuty ekranu, obszary obrazów i zeskanowane pliki PDF oraz zwracać wyniki w najpopularniejszych formatach wymiany dokumentów i danych. Różne filtry przetwarzania wstępnego umożliwiają rozpoznawanie obróconych, przekrzywionych i zaszumionych obrazów. Wydajność rozpoznawania i obciążenie systemu można dodatkowo poprawić, przenosząc zadania obliczeniowe wymagające dużej ilości zasobów do procesora graficznego .

Funkcje i możliwości Aspose.OCR dla .NET

Konwertuje obrazy i pliki PDF na tekst

Obsługuje wszystkie formaty obrazów, które można uzyskać ze skanera lub aparatu

Czyta języki oparte na łacinie i cyrylicy

Rozpoznaje ponad 6000 chińskich znaków

Wykrywa i rozpoznaje wszystkie popularne kroje pisma

Starannie zachowuje style czcionek i formatowanie

Przetwarza cały obraz lub tylko wybrane obszary

Obsługuje obrazy obrócone, przekrzywione i zaszumione

Rozpoznawanie wsadowe wszystkich obrazów w folderze lub archiwum

Rozpoznaje obrazy dostarczone jako linki internetowe

Znajduje i automatycznie poprawia błędnie napisane słowa

W pełni kompatybilny z innymi produktami Aspose

Łatwe do zainstalowania

Aspose.OCR dla platformy .NET jest dystrybuowany jako lekki pakiet NuGet lub jako plik do pobrania z minimalnymi zależnościami. Po prostu zainstaluj go w swoim projekcie i jesteś gotowy do rozpoznawania tekstów w dowolnych obsługiwanych językach i zapisywania wyników rozpoznawania w dowolnym z obsługiwanych formatów.

Poproś o tymczasową licencję , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez żadnych ograniczeń i ograniczeń.

Łatwy w użyciu

Do rozpoznania obrazu i wyświetlenia wyniku potrzebne są trzy linijki kodu. Tak, to naprawdę takie proste!

Obraz do tekstu w 3 wierszach - C#

// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Rozpoznaj obraz do tekstu
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Wyświetl wynik rozpoznawania
Console.WriteLine(result);

Wieloplatformowy

Biblioteka w pełni obsługuje .NET Standard 2.0. Oznacza to, że aplikacje mogą działać na dowolnej platformie: desktopowej Windows, Windows Server, macOS, Linux i chmurze.

26 języków rozpoznawania

OCR API może rozpoznawać dużą liczbę języków i wszystkie popularne skrypty do pisania, w tym teksty w językach mieszanych.

  • Rozszerzony alfabet łaciński : chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, niemiecki, włoski, łotewski, litewski, norweski, polski, portugalski, rumuński, słowacki, słoweński, hiszpański, szwedzki.
  • Alfabet cyrylicy : białoruski, bułgarski, kazachski, rosyjski, serbski, ukraiński.
  • Chiński : ponad 6000 znaków.

Wykrywanie języka można pozostawić bibliotece lub samodzielnie zdefiniować język, aby zwiększyć wydajność i niezawodność rozpoznawania.

Rozpoznawaj zdjęcia

Największą barierą dla aplikacji OCR jest to, że skanery nie są powszechne dla użytkowników końcowych. Interfejs API ma zaawansowane wbudowane filtry wstępnego przetwarzania obrazu, które mogą obsługiwać obrazy obrócone, przekrzywione i zaszumione. W połączeniu z obsługą wszystkich formatów obrazu pozwala na niezawodne rozpoznawanie nawet zdjęć ze smartfona. Większość wstępnego przetwarzania i korekcji obrazu odbywa się automatycznie, więc będziesz musiał interweniować tylko w trudnych przypadkach.

Zastosuj automatyczne poprawki obrazu — C#

// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Włącz automatyczne obliczanie pochylenia i kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Rozpoznaj obraz
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Uniwersalny konwerter

API może odczytać dosłownie każdy obraz, który można uzyskać ze skanera, aparatu fotograficznego lub smartfona: dokumenty PDF, JPEG, PNG, TIFF, GIF, obrazy BMP, a nawet pliki DjVu. W pełni obsługiwane są wielostronicowe dokumenty PDF, obrazy TIFF i DjVu. Możesz również dostarczyć obraz z Internetu za pośrednictwem adresu URL.

Wyniki rozpoznawania są zwracane w najpopularniejszych formatach wymiany dokumentów i danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.

Rozpoznaj PDF i zapisz wyniki w JSON - C#

// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Rozpoznaj wszystkie strony zeskanowanego pliku PDF
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Wypisz każdą stronę jako JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Optymalizacja zasobów

Optyczne rozpoznawanie znaków to proces wymagający dużej ilości zasobów. API oferuje bardzo elastyczne sposoby na znalezienie równowagi w klasycznej triadzie czas-cena-jakość:

  • Wybierz między dokładnym rozpoznaniem a szybkim rozpoznaniem.
  • Określ liczbę wątków przydzielonych do rozpoznawania lub zezwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
  • Zwolnij procesor, przenosząc obliczenia na GPU.

Szybkie rozpoznawanie - C#

// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Rozpoznaj obraz w najszybszym trybie
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Sprawdzanie pisowni

Chociaż funkcja OCR zapewnia wiarygodne wyniki, kurz i defekty druku mogą powodować nieprawidłowe rozpoznawanie niektórych symboli. Interfejs API OCR ma wbudowany moduł sprawdzania pisowni, który automatycznie zastępuje błędnie napisane słowa i uwalnia od konieczności ręcznego poprawiania wyników rozpoznawania.

Sprawdzanie pisowni w wynikach rozpoznawania — C#

// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Włącz automatyczny kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Rozpoznaj obraz
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Popraw błędnie napisane słowa
string text =  result.GetSpellCheckCorrectedText();

Przetwarzanie wsadowe

OCR API uwalnia Cię od rozpoznawania każdego obrazu jeden po drugim, oferując różne metody przetwarzania wsadowego, które pozwalają rozpoznać wiele obrazów w jednym wywołaniu:

  • Rozpoznawanie wielostronicowych plików PDF, TIFF i DjVu.
  • Rozpoznawanie wszystkich plików w folderze.
  • Rozpoznawanie wszystkich plików w archiwum.
  • Rozpoznawanie wszystkich plików z listy.

Ucz się przez przykład

Aspose.OCR for .NET zawiera szereg przykładów napisanych w C#, które pozwalają szybko zapoznać się z jego funkcjami i możliwościami oraz dają wyobrażenie o tworzeniu rozwiązań dla potrzeb biznesowych.

  

Support and Learning Resources

  
  

Aspose oferuje również natywne API OCR dla innych popularnych języków programowania: