HTML JPG OCR XML BMP
Aspose.OCR  für Java
TXT

Aspose.Imaging für Java

verarbeitet gescannte Bilder oder sogar Smartphone-Fotos im WBMP-Format und erstellt WBMP-Dokumente mit erkanntem Text. Um es zu Ihrem Projekt hinzuzufügen, müssen Sie nur Aspose.OCR abrufen.

Maven oder geben Sie die Aspose Maven Repository-Konfiguration an und installieren Sie es in Ihrem Maven-basierten Projekt, indem Sie die folgenden Konfigurationen zu pom.xml hinzufügen. Beispiele für Graddle, Ivy und Sbt finden Sie in unserem [Repository] ( https://repository.aspose.com/ocr/ ) .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Mit Java OCR und nur wenigen Codezeilen können Sie eine voll funktionsfähige Anwendung erstellen, die ein WBMP-Bild in ein TXT-Dokument konvertiert:

  • Erstellen Sie eine Instanz der Klasse AsposeOcr
  • Rufen Sie die Methode AsposeOCR.RecognizePage auf
  • Übergeben Sie den Dateipfad WBMP als Parameter
  • AsposeOCR.RecognizePage gibt einen String oder eine Datei vom Typ TXT zurück

System Anforderungen

Stellen Sie vor dem Ausführen des Beispiels sicher, dass Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) oder höher auf Ihrem System installiert ist.

  • JDK 1.6 oder höher ist installiert.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • WBMP Was ist WBMP Datei Format

    WBMP ist ein monochromes Grafikdateiformat, das für mobile Computergeräte optimiert ist. WBMP-Bilder sind monochrom (schwarzweiß), sodass die Bildgröße auf ein Minimum reduziert wird. Ein schwarzer Pixel wird mit 0 und ein weißer Pixel mit 1 bezeichnet.

    Weiterlesen

    TXT Was ist TXT Datei Format

    Eine Datei mit der Erweiterung .TXT stellt ein Textdokument dar, das einfachen Text in Form von Zeilen enthält. Absätze in einem Textdokument werden durch Carriage Returns erkannt und dienen der besseren Anordnung von Dateiinhalten. Ein Standardtextdokument kann in jedem Texteditor oder jeder Textverarbeitungsanwendung auf verschiedenen Betriebssystemen geöffnet werden. Der gesamte in einer solchen Datei enthaltene Text ist in einem für Menschen lesbaren Format und wird durch eine Zeichenfolge dargestellt.

    Weiterlesen

    TXT (Textdokumentdatei)
    Text (Textdokumentdatei)
    DOC (Von Microsoft Word generierte Dokumente)
    DOCX (Microsoft Word-Dokumente)
    XLS (Binäres Dateiformat von Microsoft Excel)
    XLSX (Microsoft Excel-Dokumente)
    PDF (Portables Dokumentenformat (PDF))
    Searchable PDF (Durchsuchbare tragbare Netzwerkgrafiken)
    XML (Erweiterbare Auszeichnungssprache)
    JSON (JavaScript-Objekt-Notation)