HTML JPG OCR XML BMP
Aspose.OCR  für Java
XML

Aspose.Imaging für Java

verarbeitet gescannte Bilder oder sogar Smartphone-Fotos im JPG-Format und erstellt JPG-Dokumente mit erkanntem Text. Um es zu Ihrem Projekt hinzuzufügen, müssen Sie nur Aspose.OCR abrufen.

Maven oder geben Sie die Aspose Maven Repository-Konfiguration an und installieren Sie es in Ihrem Maven-basierten Projekt, indem Sie die folgenden Konfigurationen zu pom.xml hinzufügen. Beispiele für Graddle, Ivy und Sbt finden Sie in unserem [Repository] ( https://repository.aspose.com/ocr/ ) .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Mit Java OCR und nur wenigen Codezeilen können Sie eine voll funktionsfähige Anwendung erstellen, die ein JPG-Bild in ein XML-Dokument konvertiert:

  • Erstellen Sie eine Instanz der Klasse AsposeOcr
  • Rufen Sie die Methode AsposeOCR.RecognizePage auf
  • Übergeben Sie den Dateipfad JPG als Parameter
  • AsposeOCR.RecognizePage gibt einen String oder eine Datei vom Typ XML zurück

System Anforderungen

Stellen Sie vor dem Ausführen des Beispiels sicher, dass Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) oder höher auf Ihrem System installiert ist.

  • JDK 1.6 oder höher ist installiert.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • JPG Was ist JPG Datei Format

    Ein JPEG ist ein Bildformat, das mit der Methode der verlustbehafteten Komprimierung gespeichert wird. Das Ausgabebild ist als Ergebnis der Komprimierung ein Kompromiss zwischen Speichergröße und Bildqualität. Benutzer können die Komprimierungsstufe anpassen, um die gewünschte Qualitätsstufe zu erreichen, während gleichzeitig die Speichergröße reduziert wird. Die Bildqualität wird vernachlässigbar beeinträchtigt, wenn eine 10:1-Komprimierung auf das Bild angewendet wird. Je höher der Komprimierungswert, desto stärker die Verschlechterung der Bildqualität.

    Weiterlesen

    XML Was ist XML Datei Format

    XML steht für Extensible Markup Language, die HTML ähnlich ist, sich jedoch in der Verwendung von Tags zum Definieren von Objekten unterscheidet. Die Grundidee hinter der Erstellung des XML-Dateiformats bestand darin, Daten zu speichern und zu transportieren, ohne von Software- oder Hardware-Tools abhängig zu sein. Seine Popularität ist darauf zurückzuführen, dass es sowohl von Menschen als auch von Maschinen lesbar ist. Dies ermöglicht es ihm, gemeinsame Datenprotokolle in Form von Objekten zu erstellen, die gespeichert und über ein Netzwerk wie das World Wide Web (WWW) geteilt werden. Das „X“ in XML steht für erweiterbar, was bedeutet, dass die Sprache gemäß den Benutzeranforderungen auf eine beliebige Anzahl von Symbolen erweitert werden kann. Für diese Funktionen nutzen viele Standarddateiformate wie Microsoft Open XML, LibreOffice OpenDocument, XHTML und SVG.

    Weiterlesen

    TXT (Textdokumentdatei)
    Text (Textdokumentdatei)
    DOC (Von Microsoft Word generierte Dokumente)
    DOCX (Microsoft Word-Dokumente)
    XLS (Binäres Dateiformat von Microsoft Excel)
    XLSX (Microsoft Excel-Dokumente)
    PDF (Portables Dokumentenformat (PDF))
    Searchable PDF (Durchsuchbare tragbare Netzwerkgrafiken)
    XML (Erweiterbare Auszeichnungssprache)
    JSON (JavaScript-Objekt-Notation)