przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie TIFF i tworzy dokumenty TIFF zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR
Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Dzięki Java OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz TIFF na dokument Searchable PDF:
- Utwórz instancję klasy AsposeOcr
- Wywołaj metodę AsposeOCR.RecognizePage
- Przekaż ścieżkę pliku TIFF jako parametr
- AsposeOCR.RecognizePage zwraca ciąg lub plik typu Searchable PDF
wymagania systemowe
Przed uruchomieniem przykładu upewnij się, że w systemie jest zainstalowana Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) lub nowsza.
- JDK 1.6 lub nowszy jest zainstalowany.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
TIFF Co jest TIFF Format pliku
TIFF lub TIF, Tagged Image File Format, reprezentuje obrazy rastrowe przeznaczone do użytku na różnych urządzeniach zgodnych z tym standardem formatu plików. Jest w stanie opisać dane obrazu dwupoziomowego, w skali szarości, w palecie kolorów i w pełnym kolorze w kilku przestrzeniach kolorów. Obsługuje stratne i bezstratne schematy kompresji, aby wybrać między przestrzenią a czasem dla aplikacji korzystających z formatu. Format jest rozszerzalny i przeszedł kilka zmian, które umożliwiają włączenie nieograniczonej ilości informacji prywatnych lub informacji specjalnego przeznaczenia. Format nie jest zależny od komputera i nie zawiera ograniczeń, takich jak procesor, system operacyjny lub systemy plików.
Czytaj więcejSearchable PDF Co jest Searchable PDF Format pliku
Przeszukiwalne pliki PDF zachowują oryginalny zeskanowany obraz do przeglądania, a także tekst OCR w ukrytej warstwie, która może być używana do wyszukiwania pełnotekstowego w dokumencie lub podświetlania tekstu do operacji kopiowania i wklejania. Pełna konwersja OCR do formatu PDF, bez oryginalnego obrazu, nigdy nie zachowa 100% oryginalnego formatowania, zwłaszcza jeśli dokument zawiera wiele obrazów lub złożony układ.
Czytaj więcej