HTML JPG OCR XML BMP
Aspose.OCR  dla Java
DOCX

Aspose.Imaging dla Javy

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie GIF i tworzy dokumenty GIF zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR

Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Dzięki Java OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz GIF na dokument DOCX:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.RecognizePage
  • Przekaż ścieżkę pliku GIF jako parametr
  • AsposeOCR.RecognizePage zwraca ciąg lub plik typu DOCX

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że w systemie jest zainstalowana Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) lub nowsza.

  • JDK 1.6 lub nowszy jest zainstalowany.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • GIF Co jest GIF Format pliku

    GIF lub Graphical Interchange Format to rodzaj wysoce skompresowanego obrazu. Będący własnością Unisys plik GIF wykorzystuje algorytm kompresji LZW, który nie pogarsza jakości obrazu. Dla każdego obrazu GIF zazwyczaj dopuszcza do 8 bitów na piksel i do 256 kolorów na całym obrazie. W przeciwieństwie do obrazu JPEG, który może wyświetlać do 16 milionów kolorów i dość mocno dotyka granic ludzkiego oka. Kiedy pojawił się internet, GIF-y pozostały najlepszym wyborem, ponieważ wymagały niskiej przepustowości i były kompatybilne z grafiką, która pochłania jednolite obszary koloru. Animowany GIF łączy wiele obrazów lub klatek w jeden plik i wyświetla je w sekwencji, aby wygenerować animowany klip lub krótki film. Ograniczenia kolorów wynoszą do 256 dla każdej klatki i prawdopodobnie będą najmniej odpowiednie do reprodukcji innych obrazów i fotografii z gradientem kolorów.

    Czytaj więcej

    DOCX Co jest DOCX Format pliku

    DOCX to dobrze znany format dokumentów Microsoft Word. Wprowadzony w 2007 roku wraz z wydaniem pakietu Microsoft Office 2007, struktura tego nowego formatu dokumentu została zmieniona ze zwykłego binarnego na kombinację plików XML i binarnych. Pliki Docx można otwierać w programie Word 2007 i wersjach pobocznych, ale nie we wcześniejszych wersjach programu MS Word, które obsługują rozszerzenia plików DOC.

    Czytaj więcej

    TXT (Plik dokumentu tekstowego)
    Text (Plik dokumentu tekstowego)
    DOC (Dokumenty generowane przez Microsoft Word)
    DOCX (Dokumenty Microsoft Word)
    XLS (Format pliku binarnego Microsoft Excel)
    XLSX (Dokumenty Microsoft Excel)
    PDF (Przenośny format dokumentu (PDF))
    Searchable PDF (Przeszukiwalna przenośna grafika sieciowa)
    XML (Rozszerzalny język znaczników)
    JSON (Notacja obiektu JavaScript)