Konwertuj obrazy i pliki PDF na tekst w Javie
Z łatwością twórz wieloplatformowe aplikacje Java z funkcjami optycznego rozpoznawania znaków (OCR).
Download Free TrialAspose.OCR for Java umożliwia wyodrębnianie tekstu z obrazów, zrzutów ekranu, określonych obszarów obrazu i tworzenie przeszukiwalnych plików PDF z zeskanowanych plików na dowolnej platformie obsługującej język Java. Dzięki potężnemu, ale łatwemu w użyciu interfejsowi API, nawet złożone zadania OCR zajmują mniej niż 10 wierszy kodu. Nie musisz pracować z formułami i uczeniem maszynowym - biblioteka zadba o wszystkie szczegóły techniczne i da wiarygodne wyniki w 26 językach opartych na skryptach łacińskich i cyrylicy , a także chińskim . OCR API przetwarza zeskanowane obrazy, zdjęcia ze smartfona, zrzuty ekranu, obszary obrazów oraz zeskanowane pliki PDF i zwraca wyniki w najpopularniejszych formatach dokumentów. Szybkość, dokładność i wydajność rozpoznawania można dodatkowo poprawić, rozprowadzając obliczenia na wielu rdzeniach procesora i przenosząc zadania wymagające dużych zasobów na procesor graficzny .
Funkcje i możliwości Aspose.OCR dla Java
Rozpoznaje sformatowany tekst w zeskanowanych obrazach i plikach PDF
Obsługuje wszystkie formaty plików, które można uzyskać ze skanera lub aparatu
Czyta pisma łacińskie i cyrylicę
Rozpoznaje ponad 6000 chińskich znaków
Wykrywa i rozpoznaje wszystkie popularne kroje pisma
Starannie zachowuje style czcionek i formatowanie
Przetwarza cały obraz lub tylko wybrane obszary
Obsługuje obrazy obrócone, przekrzywione i zaszumione
Rozpoznawanie wsadowe wszystkich obrazów w folderze lub archiwum
Rozpoznaje obrazy dostarczone jako linki internetowe
Znajduje i automatycznie poprawia błędnie napisane słowa
100% kompatybilność z innymi produktami Aspose
Łatwe do zainstalowania
Możesz użyć Aspose.OCR for Java bezpośrednio z projektu opartego na Maven , postępując zgodnie z prostymi instrukcjami instalacji .
Poproś o tymczasową licencję , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez żadnych ograniczeń i ograniczeń.
$Easy to Use$
Rozpoznawanie obrazu wymaga kilku linijek kodu. Dosłownie. To naprawdę takie proste - spróbuj sam:
Obraz do tekstu w 7 wierszach - Java
// Utwórz instancję OCR API
AsposeOCR api = new AsposeOCR();
try {
// Rozpoznaj obraz
String result = api.RecognizePage(imagePath);
// Wyświetl wynik rozpoznawania
System.out.println("Recognized text: " + result);
} catch (IOException e) {
// Obsługa błędów
e.printStackTrace();
}
26 języków rozpoznawania
OCR API obsługuje dużą liczbę języków i wszystkie popularne skrypty do pisania, w tym teksty w językach mieszanych. Wbudowany moduł sprawdzania pisowni automatycznie zastępuje błędnie napisane słowa i oszczędza kłopotów z ręcznym poprawianiem wyników rozpoznawania.
- Rozszerzony alfabet łaciński : chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, niemiecki, włoski, łotewski, litewski, norweski, polski, portugalski, rumuński, słowacki, słoweński, hiszpański, szwedzki.
- Alfabet cyrylicy : białoruski, bułgarski, kazachski, rosyjski, serbski, ukraiński.
- Chiński : ponad 6000 znaków.
Możesz określić język, aby zwiększyć wydajność i niezawodność rozpoznawania lub pozwolić interfejsowi API na automatyczne wykrywanie języków.
Zachowaj formatowanie
Interfejs API OCR odczytuje wszystkie popularne kroje pisma, takie jak Arial, Times New Roman, Courier New, Tahoma, Calibri i inne, w stylu zwykłym, pogrubionym i kursywą oraz starannie zachowuje formatowanie w wynikach OCR. Możesz także podzielić wyniki rozpoznawania na wiersze i wykryć obszary tekstowe na stronie.
Rozpoznawaj zdjęcia
Skaner nie zawsze jest dostępny na stacjach roboczych użytkowników końcowych, co może stać się przeszkodą dla aplikacji OCR. Nasz interfejs API OCR zapewnia szereg filtrów przetwarzania wstępnego, które mogą obsługiwać obrazy zniekształcone, obrócone, przekrzywione i zaszumione. W połączeniu z obsługą wszystkich formatów obrazu pozwala na niezawodne rozpoznawanie nawet zdjęć ze smartfona. Większość obróbki wstępnej i korekcji obrazu odbywa się automatycznie, ale zawsze można interweniować w trudnych przypadkach.
Zastosuj poprawki obrazu - Java
// Utwórz instancję OCR API
AsposeOCR api = new AsposeOCR();
// Zdefiniuj filtry przetwarzania wstępnego
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Wstępnie przetworzyć obraz przed rozpoznaniem
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Rozpoznaj obraz
RecognitionResult result = api.RecognizePage(imageRes, set);
Optymalizacja wydajności
Optyczne rozpoznawanie znaków wymaga dużej ilości zasobów przetwarzania, co może stanowić problem w przypadku usług internetowych i urządzeń klasy podstawowej. Interfejs API oferuje bardzo elastyczne sposoby zrównoważenia szybkości rozpoznawania, wymagań dotyczących zasobów i dokładności:
- Wybierz między dokładnym rozpoznaniem a szybkim rozpoznaniem.
- Określ liczbę wątków przydzielonych do rozpoznawania lub zezwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
- Zwolnij procesor, przenosząc obliczenia na GPU.
Szybkie rozpoznawanie - Java
// Utwórz instancję OCR API
AsposeOCR api = new AsposeOCR();
// Rozpoznaj obraz w najszybszym trybie
String result = api.RecognizePageFast("sample.jpg");
Przetwarzanie wsadowe
Interfejs API OCR uwalnia Cię od konieczności rozpoznawania każdego obrazu pojedynczo, oferując różne metody przetwarzania wsadowego, które pozwalają rozpoznać wiele obrazów w jednym wywołaniu:
- Rozpoznawanie wielostronicowych plików PDF i TIFF.
- Rozpoznawanie wszystkich plików w archiwum.
- Rozpoznawanie wszystkich plików w folderze.
Support and Learning Resources
- Zasoby edukacyjne
- Dokumentacja
- Kod źródłowy
- Referencje API
- Filmy instruktażowe
- Wsparcie produktu
- Bezpłatne wsparcie
- Płatne wsparcie
- Blog
- Informacje o wydaniu
- Dlaczego Aspose.OCR dla Javy?
- Lista klientów
- Historie sukcesów