HTML JPG OCR XML BMP
Aspose.OCR  dla Java
TXT

Aspose.Imaging dla Javy

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie DJVU i tworzy dokumenty DJVU zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR

Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Dzięki Java OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz DJVU na dokument TXT:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.RecognizePage
  • Przekaż ścieżkę pliku DJVU jako parametr
  • AsposeOCR.RecognizePage zwraca ciąg lub plik typu TXT

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że w systemie jest zainstalowana Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) lub nowsza.

  • JDK 1.6 lub nowszy jest zainstalowany.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • DJVU Co jest DJVU Format pliku

    DjVu, wymawiane jako „déjà vu”, to format plików graficznych przeznaczony dla zeskanowanych dokumentów i książek, zwłaszcza zawierających kombinację tekstu, rysunków, obrazów i fotografii. Został opracowany przez AT&T Labs. Wykorzystuje wiele technik, takich jak separacja warstw obrazu tekstu i obrazów tła, ładowanie progresywne, kodowanie arytmetyczne i kompresja stratna dla obrazów dwukolorowych. Ponieważ plik DJVU może zawierać skompresowane, ale wysokiej jakości kolorowe obrazy, zdjęcia, tekst i rysunki, i może być zapisany na mniejszej przestrzeni, dlatego jest używany w Internecie jako e-booki, podręczniki, gazety, starożytne dokumenty itp.

    Czytaj więcej

    TXT Co jest TXT Format pliku

    Plik z rozszerzeniem .TXT reprezentuje dokument tekstowy, który zawiera zwykły tekst w postaci linii. Akapity w dokumencie tekstowym są rozpoznawane przez znaki powrotu karetki i służą do lepszego rozmieszczenia zawartości pliku. Standardowy dokument tekstowy można otworzyć w dowolnym edytorze tekstu lub aplikacji do przetwarzania tekstu w różnych systemach operacyjnych. Cały tekst zawarty w takim pliku jest w formacie czytelnym dla człowieka i reprezentowany przez ciąg znaków.

    Czytaj więcej