HTML JPG OCR XML BMP
Aspose.OCR  dla Java
DOC

Aspose.Imaging dla Javy

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie TIF i tworzy dokumenty TIF zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR

Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Dzięki Java OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz TIF na dokument DOC:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.RecognizePage
  • Przekaż ścieżkę pliku TIF jako parametr
  • AsposeOCR.RecognizePage zwraca ciąg lub plik typu DOC

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że w systemie jest zainstalowana Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) lub nowsza.

  • JDK 1.6 lub nowszy jest zainstalowany.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • TIF Co jest TIF Format pliku

    TIFF lub TIF, Tagged Image File Format, reprezentuje obrazy rastrowe przeznaczone do użytku na różnych urządzeniach zgodnych z tym standardem formatu plików. Jest w stanie opisać dane obrazu dwupoziomowego, w skali szarości, w palecie kolorów i w pełnym kolorze w kilku przestrzeniach kolorów. Obsługuje stratne i bezstratne schematy kompresji, aby wybrać między przestrzenią a czasem dla aplikacji korzystających z formatu. Format jest rozszerzalny i przeszedł kilka zmian, które umożliwiają włączenie nieograniczonej ilości informacji prywatnych lub informacji specjalnego przeznaczenia. Format nie jest zależny od komputera i nie zawiera ograniczeń, takich jak procesor, system operacyjny lub systemy plików.

    Czytaj więcej

    DOC Co jest DOC Format pliku

    Pliki z rozszerzeniem .doc reprezentują dokumenty generowane przez Microsoft Word lub inne dokumenty edytora tekstu w formacie pliku binarnego. Rozszerzenie było początkowo używane do dokumentacji w postaci zwykłego tekstu w kilku różnych systemach operacyjnych. Może zawierać kilka różnych typów danych, takich jak obrazy, sformatowany i zwykły tekst, wykresy, wykresy, osadzone obiekty, linki, strony, formatowanie stron, ustawienia drukowania i wiele innych. Format ten był popularny w przypadku wszelkiego rodzaju dokumentacji ze względu na różnorodność opcji, jakie oferuje użytkownikom w zakresie pisania podręczników, propozycji, specyfikacji, życiorysów, artykułów lub innych podobnych dokumentów. Zaktualizowaną wersją DOC jest DOCX, który jest oparty na Office OpenXML, którego specyfikacje są publicznie dostępne.

    Czytaj więcej

    TXT (Plik dokumentu tekstowego)
    Text (Plik dokumentu tekstowego)
    DOC (Dokumenty generowane przez Microsoft Word)
    DOCX (Dokumenty Microsoft Word)
    XLS (Format pliku binarnego Microsoft Excel)
    XLSX (Dokumenty Microsoft Excel)
    PDF (Przenośny format dokumentu (PDF))
    Searchable PDF (Przeszukiwalna przenośna grafika sieciowa)
    XML (Rozszerzalny język znaczników)
    JSON (Notacja obiektu JavaScript)