HTML JPG OCR XML BMP
Aspose.OCR  dla Java
PDF

Aspose.Imaging dla Javy

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie BMP i tworzy dokumenty BMP zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR

Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Dzięki Java OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz BMP na dokument PDF:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.RecognizePage
  • Przekaż ścieżkę pliku BMP jako parametr
  • AsposeOCR.RecognizePage zwraca ciąg lub plik typu PDF

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że w systemie jest zainstalowana Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) lub nowsza.

  • JDK 1.6 lub nowszy jest zainstalowany.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • BMP Co jest BMP Format pliku

    Pliki o rozszerzeniu .BMP reprezentują pliki obrazów bitmapowych, które są używane do przechowywania cyfrowych obrazów bitmapowych. Obrazy te są niezależne od karty graficznej i są również nazywane formatem plików mapy bitowej niezależnej od urządzenia (DIB). Ta niezależność służy do otwierania pliku na wielu platformach, takich jak Microsoft Windows i Mac. Format pliku BMP może przechowywać dane jako dwuwymiarowe obrazy cyfrowe zarówno w formacie monochromatycznym, jak i kolorowym z różnymi głębiami kolorów.

    Czytaj więcej

    PDF Co jest PDF Format pliku

    Portable Document Format (PDF) to rodzaj dokumentu stworzony przez firmę Adobe w latach 90. XX wieku. Celem tego formatu pliku było wprowadzenie standardu reprezentacji dokumentów i innych materiałów referencyjnych w formacie niezależnym od oprogramowania aplikacji, sprzętu oraz systemu operacyjnego. Format pliku PDF ma pełną zdolność do przechowywania informacji, takich jak tekst, obrazy, hiperłącza, pola formularzy, multimedia, podpisy cyfrowe, załączniki, metadane, funkcje geoprzestrzenne i obiekty 3D, które mogą stać się częścią dokumentu źródłowego.

    Czytaj więcej

    TXT (Plik dokumentu tekstowego)
    Text (Plik dokumentu tekstowego)
    DOC (Dokumenty generowane przez Microsoft Word)
    DOCX (Dokumenty Microsoft Word)
    XLS (Format pliku binarnego Microsoft Excel)
    XLSX (Dokumenty Microsoft Excel)
    PDF (Przenośny format dokumentu (PDF))
    Searchable PDF (Przeszukiwalna przenośna grafika sieciowa)
    XML (Rozszerzalny język znaczników)
    JSON (Notacja obiektu JavaScript)