przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie JP2 i tworzy dokumenty JP2 zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR
Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Dzięki Java OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz JP2 na dokument DOCX:
- Utwórz instancję klasy AsposeOcr
- Wywołaj metodę AsposeOCR.RecognizePage
- Przekaż ścieżkę pliku JP2 jako parametr
- AsposeOCR.RecognizePage zwraca ciąg lub plik typu DOCX
wymagania systemowe
Przed uruchomieniem przykładu upewnij się, że w systemie jest zainstalowana Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) lub nowsza.
- JDK 1.6 lub nowszy jest zainstalowany.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
JP2 Co jest JP2 Format pliku
JPEG 2000 (JP2) to system kodowania obrazu i najnowocześniejszy standard kompresji obrazu. Zaprojektowany przy użyciu technologii wavelet JPEG 2000 może kodować bezstratne treści w dowolnej jakości na raz. Co więcej, bez znaczącej utraty wydajności kodowania, JPEG 2000 ma możliwość skutecznego dostępu i dekodowania tej samej treści w różnych innych rozdzielczościach i jakościach. Strumienie kodu w JPEG 2000 są znacznie skalowalne, posiadając obszary zainteresowania, które zapewniają możliwość przestrzennego dostępu losowego. Posiada do 16384 różnych komponentów o wymiarach w terapikselach i precyzji, która może sięgać nawet 38 bitów na próbkę.
Czytaj więcejDOCX Co jest DOCX Format pliku
DOCX to dobrze znany format dokumentów Microsoft Word. Wprowadzony w 2007 roku wraz z wydaniem pakietu Microsoft Office 2007, struktura tego nowego formatu dokumentu została zmieniona ze zwykłego binarnego na kombinację plików XML i binarnych. Pliki Docx można otwierać w programie Word 2007 i wersjach pobocznych, ale nie we wcześniejszych wersjach programu MS Word, które obsługują rozszerzenia plików DOC.
Czytaj więcej