Aspose.OCR  for Java

Konwertuj obrazy i pliki PDF na tekst w Javie

Z łatwością twórz wieloplatformowe aplikacje Java z funkcjami optycznego rozpoznawania znaków (OCR).

  Download Free Trial
  
 

Aspose.OCR for Java umożliwia wyodrębnianie tekstu z obrazów, zrzutów ekranu, określonych obszarów obrazu i tworzenie przeszukiwalnych plików PDF z zeskanowanych plików na dowolnej platformie obsługującej język Java. Dzięki potężnemu, ale łatwemu w użyciu interfejsowi API, nawet złożone zadania OCR zajmują mniej niż 10 wierszy kodu. Nie musisz pracować z formułami i uczeniem maszynowym - biblioteka zadba o wszystkie szczegóły techniczne i da wiarygodne wyniki w 26 językach opartych na skryptach łacińskich i cyrylicy , a także chińskim . OCR API przetwarza zeskanowane obrazy, zdjęcia ze smartfona, zrzuty ekranu, obszary obrazów oraz zeskanowane pliki PDF i zwraca wyniki w najpopularniejszych formatach dokumentów. Szybkość, dokładność i wydajność rozpoznawania można dodatkowo poprawić, rozprowadzając obliczenia na wielu rdzeniach procesora i przenosząc zadania wymagające dużych zasobów na procesor graficzny .

Funkcje i możliwości Aspose.OCR dla Java

Rozpoznaje sformatowany tekst w zeskanowanych obrazach i plikach PDF

Obsługuje wszystkie formaty plików, które można uzyskać ze skanera lub aparatu

Czyta pisma łacińskie i cyrylicę

Rozpoznaje ponad 6000 chińskich znaków

Wykrywa i rozpoznaje wszystkie popularne kroje pisma

Starannie zachowuje style czcionek i formatowanie

Przetwarza cały obraz lub tylko wybrane obszary

Obsługuje obrazy obrócone, przekrzywione i zaszumione

Rozpoznawanie wsadowe wszystkich obrazów w folderze lub archiwum

Rozpoznaje obrazy dostarczone jako linki internetowe

Znajduje i automatycznie poprawia błędnie napisane słowa

100% kompatybilność z innymi produktami Aspose

Łatwe do zainstalowania

Możesz użyć Aspose.OCR for Java bezpośrednio z projektu opartego na Maven , postępując zgodnie z prostymi instrukcjami instalacji .

Poproś o tymczasową licencję , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez żadnych ograniczeń i ograniczeń.

$Easy to Use$

Rozpoznawanie obrazu wymaga kilku linijek kodu. Dosłownie. To naprawdę takie proste - spróbuj sam:

Obraz do tekstu w 7 wierszach - Java

// Utwórz instancję OCR API
AsposeOCR api = new AsposeOCR();

try {
    // Rozpoznaj obraz
    String result = api.RecognizePage(imagePath);
    // Wyświetl wynik rozpoznawania
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // Obsługa błędów
    e.printStackTrace();
}

26 języków rozpoznawania

OCR API obsługuje dużą liczbę języków i wszystkie popularne skrypty do pisania, w tym teksty w językach mieszanych. Wbudowany moduł sprawdzania pisowni automatycznie zastępuje błędnie napisane słowa i oszczędza kłopotów z ręcznym poprawianiem wyników rozpoznawania.

  • Rozszerzony alfabet łaciński : chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, niemiecki, włoski, łotewski, litewski, norweski, polski, portugalski, rumuński, słowacki, słoweński, hiszpański, szwedzki.
  • Alfabet cyrylicy : białoruski, bułgarski, kazachski, rosyjski, serbski, ukraiński.
  • Chiński : ponad 6000 znaków.

Możesz określić język, aby zwiększyć wydajność i niezawodność rozpoznawania lub pozwolić interfejsowi API na automatyczne wykrywanie języków.

Zachowaj formatowanie

Interfejs API OCR odczytuje wszystkie popularne kroje pisma, takie jak Arial, Times New Roman, Courier New, Tahoma, Calibri i inne, w stylu zwykłym, pogrubionym i kursywą oraz starannie zachowuje formatowanie w wynikach OCR. Możesz także podzielić wyniki rozpoznawania na wiersze i wykryć obszary tekstowe na stronie.

Rozpoznawaj zdjęcia

Skaner nie zawsze jest dostępny na stacjach roboczych użytkowników końcowych, co może stać się przeszkodą dla aplikacji OCR. Nasz interfejs API OCR zapewnia szereg filtrów przetwarzania wstępnego, które mogą obsługiwać obrazy zniekształcone, obrócone, przekrzywione i zaszumione. W połączeniu z obsługą wszystkich formatów obrazu pozwala na niezawodne rozpoznawanie nawet zdjęć ze smartfona. Większość obróbki wstępnej i korekcji obrazu odbywa się automatycznie, ale zawsze można interweniować w trudnych przypadkach.

Zastosuj poprawki obrazu - Java

// Utwórz instancję OCR API
AsposeOCR api = new AsposeOCR();

// Zdefiniuj filtry przetwarzania wstępnego
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Wstępnie przetworzyć obraz przed rozpoznaniem
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Rozpoznaj obraz
RecognitionResult result = api.RecognizePage(imageRes, set);

Optymalizacja wydajności

Optyczne rozpoznawanie znaków wymaga dużej ilości zasobów przetwarzania, co może stanowić problem w przypadku usług internetowych i urządzeń klasy podstawowej. Interfejs API oferuje bardzo elastyczne sposoby zrównoważenia szybkości rozpoznawania, wymagań dotyczących zasobów i dokładności:

  • Wybierz między dokładnym rozpoznaniem a szybkim rozpoznaniem.
  • Określ liczbę wątków przydzielonych do rozpoznawania lub zezwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
  • Zwolnij procesor, przenosząc obliczenia na GPU.

Szybkie rozpoznawanie - Java

// Utwórz instancję OCR API
AsposeOCR api = new AsposeOCR();

// Rozpoznaj obraz w najszybszym trybie
String result = api.RecognizePageFast("sample.jpg");

Przetwarzanie wsadowe

Interfejs API OCR uwalnia Cię od konieczności rozpoznawania każdego obrazu pojedynczo, oferując różne metody przetwarzania wsadowego, które pozwalają rozpoznać wiele obrazów w jednym wywołaniu:

  • Rozpoznawanie wielostronicowych plików PDF i TIFF.
  • Rozpoznawanie wszystkich plików w archiwum.
  • Rozpoznawanie wszystkich plików w folderze.
  
  

Aspose oferuje również natywne API OCR dla innych popularnych języków programowania: