przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie JPG i tworzy dokumenty JPG zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR
Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Dzięki Java OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz JPG na dokument XLSX:
- Utwórz instancję klasy AsposeOcr
- Wywołaj metodę AsposeOCR.RecognizePage
- Przekaż ścieżkę pliku JPG jako parametr
- AsposeOCR.RecognizePage zwraca ciąg lub plik typu XLSX
wymagania systemowe
Przed uruchomieniem przykładu upewnij się, że w systemie jest zainstalowana Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) lub nowsza.
- JDK 1.6 lub nowszy jest zainstalowany.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
JPG Co jest JPG Format pliku
JPEG to rodzaj formatu obrazu, który jest zapisywany przy użyciu metody kompresji stratnej. Obraz wyjściowy w wyniku kompresji jest kompromisem między rozmiarem pamięci a jakością obrazu. Użytkownicy mogą dostosować poziom kompresji, aby osiągnąć pożądany poziom jakości, jednocześnie zmniejszając rozmiar pamięci. Jakość obrazu ulega nieznacznemu pogorszeniu, jeśli do obrazu zostanie zastosowana kompresja 10:1. Im wyższa wartość kompresji, tym większa degradacja jakości obrazu.
Czytaj więcejXLSX Co jest XLSX Format pliku
XLSX to dobrze znany format dokumentów programu Microsoft Excel, który został wprowadzony przez firmę Microsoft wraz z wydaniem pakietu Microsoft Office 2007. W oparciu o strukturę zorganizowaną zgodnie z konwencjami otwartego pakowania, jak określono w części 2 standardu OOXML ECMA-376, nowy format jest pakiet zip, który zawiera wiele plików XML. Bazową strukturę i pliki można sprawdzić, po prostu rozpakowując plik .xlsx.
Czytaj więcej