HTML JPG OCR XML BMP
Aspose.OCR  für Java
XLSX

Aspose.Imaging für Java

verarbeitet gescannte Bilder oder sogar Smartphone-Fotos im WBMP-Format und erstellt WBMP-Dokumente mit erkanntem Text. Um es zu Ihrem Projekt hinzuzufügen, müssen Sie nur Aspose.OCR abrufen.

Maven oder geben Sie die Aspose Maven Repository-Konfiguration an und installieren Sie es in Ihrem Maven-basierten Projekt, indem Sie die folgenden Konfigurationen zu pom.xml hinzufügen. Beispiele für Graddle, Ivy und Sbt finden Sie in unserem [Repository] ( https://repository.aspose.com/ocr/ ) .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Mit Java OCR und nur wenigen Codezeilen können Sie eine voll funktionsfähige Anwendung erstellen, die ein WBMP-Bild in ein XLSX-Dokument konvertiert:

  • Erstellen Sie eine Instanz der Klasse AsposeOcr
  • Rufen Sie die Methode AsposeOCR.RecognizePage auf
  • Übergeben Sie den Dateipfad WBMP als Parameter
  • AsposeOCR.RecognizePage gibt einen String oder eine Datei vom Typ XLSX zurück

System Anforderungen

Stellen Sie vor dem Ausführen des Beispiels sicher, dass Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) oder höher auf Ihrem System installiert ist.

  • JDK 1.6 oder höher ist installiert.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • WBMP Was ist WBMP Datei Format

    WBMP ist ein monochromes Grafikdateiformat, das für mobile Computergeräte optimiert ist. WBMP-Bilder sind monochrom (schwarzweiß), sodass die Bildgröße auf ein Minimum reduziert wird. Ein schwarzer Pixel wird mit 0 und ein weißer Pixel mit 1 bezeichnet.

    Weiterlesen

    XLSX Was ist XLSX Datei Format

    XLSX ist ein bekanntes Format für Microsoft Excel-Dokumente, das von Microsoft mit der Veröffentlichung von Microsoft Office 2007 eingeführt wurde. Das neue Format basiert auf einer Struktur, die gemäß den Open Packaging Conventions organisiert ist, wie in Teil 2 des OOXML-Standards ECMA-376 beschrieben ein ZIP-Paket, das eine Reihe von XML-Dateien enthält. Die zugrunde liegende Struktur und Dateien können durch einfaches Entpacken der .xlsx-Datei untersucht werden.

    Weiterlesen

    TXT (Textdokumentdatei)
    Text (Textdokumentdatei)
    DOC (Von Microsoft Word generierte Dokumente)
    DOCX (Microsoft Word-Dokumente)
    XLS (Binäres Dateiformat von Microsoft Excel)
    XLSX (Microsoft Excel-Dokumente)
    PDF (Portables Dokumentenformat (PDF))
    Searchable PDF (Durchsuchbare tragbare Netzwerkgrafiken)
    XML (Erweiterbare Auszeichnungssprache)
    JSON (JavaScript-Objekt-Notation)