przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie DJVU i tworzy dokumenty DJVU zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR
Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Dzięki Java OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz DJVU na dokument DOC:
- Utwórz instancję klasy AsposeOcr
- Wywołaj metodę AsposeOCR.RecognizePage
- Przekaż ścieżkę pliku DJVU jako parametr
- AsposeOCR.RecognizePage zwraca ciąg lub plik typu DOC
wymagania systemowe
Przed uruchomieniem przykładu upewnij się, że w systemie jest zainstalowana Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) lub nowsza.
- JDK 1.6 lub nowszy jest zainstalowany.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
DJVU Co jest DJVU Format pliku
DjVu, wymawiane jako „déjà vu”, to format plików graficznych przeznaczony dla zeskanowanych dokumentów i książek, zwłaszcza zawierających kombinację tekstu, rysunków, obrazów i fotografii. Został opracowany przez AT&T Labs. Wykorzystuje wiele technik, takich jak separacja warstw obrazu tekstu i obrazów tła, ładowanie progresywne, kodowanie arytmetyczne i kompresja stratna dla obrazów dwukolorowych. Ponieważ plik DJVU może zawierać skompresowane, ale wysokiej jakości kolorowe obrazy, zdjęcia, tekst i rysunki, i może być zapisany na mniejszej przestrzeni, dlatego jest używany w Internecie jako e-booki, podręczniki, gazety, starożytne dokumenty itp.
Czytaj więcejDOC Co jest DOC Format pliku
Pliki z rozszerzeniem .doc reprezentują dokumenty generowane przez Microsoft Word lub inne dokumenty edytora tekstu w formacie pliku binarnego. Rozszerzenie było początkowo używane do dokumentacji w postaci zwykłego tekstu w kilku różnych systemach operacyjnych. Może zawierać kilka różnych typów danych, takich jak obrazy, sformatowany i zwykły tekst, wykresy, wykresy, osadzone obiekty, linki, strony, formatowanie stron, ustawienia drukowania i wiele innych. Format ten był popularny w przypadku wszelkiego rodzaju dokumentacji ze względu na różnorodność opcji, jakie oferuje użytkownikom w zakresie pisania podręczników, propozycji, specyfikacji, życiorysów, artykułów lub innych podobnych dokumentów. Zaktualizowaną wersją DOC jest DOCX, który jest oparty na Office OpenXML, którego specyfikacje są publicznie dostępne.
Czytaj więcej