Deutsch
  1. Produkte
  2.   Aspose.Total
  3.   Python via .NET
  4.   Parse
  5.   Extrahieren Sie Text und Bilder online und mit Python aus einer WORD-Datei

Analysieren Sie WORD-Dateien online und extrahieren Sie Text oder Bilder über Python

Entwickeln Sie eine leistungsstarke Python-basierte WORD-Dokumentparser-Dienstprogrammanwendung.Code für WORD-Dokumentbilder und Textextraktion über Python aufgeführt.

Analysieren Sie das WORD-Dokument über die Online-App

  1. Importieren Sie die WORD-Datei zum Parsen, indem Sie sie hochladen.
  2. Klicken Sie dazu per Drag & Drop der Parser-App in den Drop-Bereich.
  3. Warten Sie je nach Größe der WORD-Datei und Internetgeschwindigkeit einige Sekunden.
  4. Klicken Sie auf die Schaltfläche „Jetzt analysieren“, um das Dokument zu analysieren.
  5. Laden Sie die analysierten Dateien herunter, um sie sofort anzuzeigen.

Extrahieren Sie Text aus einer WORD-Datei mit Python

  1. Referenzieren Sie APIs innerhalb des Projekts direkt aus PyPI ( Aspose.Words )
  2. Definieren Sie Knoten, die in den Textextraktionsprozess einbezogen werden sollen
  3. Schließen Sie den ersten und letzten Knoten ein oder aus
  4. Extrahieren Sie Inhalte in bestimmten Knoten
  5. Erstellen Sie ein separates WORD-Dokument für extrahierten Text
  6. In der Funktion extract_content aufgeführter Code.
 

Codebeispiel in Python zum Extrahieren von WORD-Dokumenttext

 

Extrahieren Sie Bilder aus einer WORD-Datei über Python

  1. Referenzieren Sie APIs innerhalb des Projekts direkt aus PyPI ( Aspose.Words )
  2. Bilder, die in Formknoten des Dokumentobjekts gespeichert sind
  3. Um alle Shape-Knoten auszuwählen, verwenden Sie die Methode Document.get_child_nodes
  4. Durchlaufen Sie die resultierenden Knotensammlungen
  5. Wenn Shape.has_image true zurückgibt.
  6. Verwenden Sie die Eigenschaft Shape.image_data, um Bilddaten zu extrahieren.
  7. Bilddaten in einer Datei speichern
 

Codebeispiel in Python zum Extrahieren von WORD-Dokumentbildern

 
 

Entwickeln Sie eine WORD-Dateiparser-Anwendung über Python

Müssen Sie eine WORD-Parser-App oder ein WORD-Parser-Dienstprogramm entwickeln?Da Aspose.Words for Python via .NET eine untergeordnete API von Aspose.Total for Python via .NET ist, kann jeder Python-Entwickler den oben genannten API-Code in seine Dokumentparser-Anwendung integrieren.Die leistungsstarke Python-Bibliothek ermöglicht die Programmierung jeder Lösung zum Parsen von Dokumenten, um sowohl Bilder als auch Text zu extrahieren.Darüber hinaus unterstützt es viele gängige Formate, einschließlich des WORD-Formats.

Python-Dienstprogramm zum Verarbeiten der WORD-Datei für die Parser-App

Es gibt alternative Möglichkeiten, „ Aspose.Words for Python via .NET “ oder „ Aspose.Total for Python via .NET “ auf Ihrem System zu installieren.Bitte wählen Sie eines aus, das Ihren Anforderungen entspricht, und befolgen Sie die Schritt-für-Schritt-Anleitung:

System Anforderungen

  • Python 3.5 oder höher ist installiert
  • GCC-6-Laufzeitbibliotheken (oder höher).
  • Abhängigkeiten von .NET Core Runtime. Die Installation von .NET Core Runtime selbst ist NICHT erforderlich.
  • Für Python 3.5-3.7: Der pymalloc-Build von Python wird benötigt.

    Weitere Einzelheiten finden Sie unter Produktdokumentation .

FAQs

  • Kann ich den oben genannten Python-Code in meiner Anwendung verwenden?
    Ja, Sie können diesen Code gerne herunterladen und für die Entwicklung einer Python-basierten Dokument-Parser-Anwendung verwenden.Dieser Code kann als wertvolle Ressource zur Verbesserung der Funktionalität und Leistungsfähigkeit Ihrer Projekte im Bereich der Backend-Dokumentverarbeitung dienen, z. B. beim Lesen von Knoten und beim Laden des Dokuments zur Text- und Bildextraktion.
  • Funktioniert diese Online-Dokumentparser-App nur unter Windows?
    Sie haben die Flexibilität, das Parsen von Dokumenten auf jedem Gerät zu starten, unabhängig vom Betriebssystem, auf dem es ausgeführt wird, sei es Windows, Linux, Mac OS oder Android.Sie benötigen lediglich einen modernen Webbrowser und eine aktive Internetverbindung.
  • Ist es sicher, die Online-App zum Parsen von WORD-Dokumenten zu verwenden?
    Natürlich! Die über unseren Dienst generierten Ausgabedateien werden innerhalb von 24 Stunden sicher und automatisch von unseren Servern entfernt.Dies hat zur Folge, dass die mit diesen Dateien verbundenen Anzeigelinks nach diesem Zeitraum nicht mehr funktionsfähig sind.
  • Welchen Browser sollte ich verwenden, um die App zu verwenden?
    Sie können jeden modernen Webbrowser wie Google Chrome, Firefox, Opera oder Safari für den Online-Parser von WORD-Dokumenten verwenden.Wenn Sie jedoch eine Desktop-Anwendung entwickeln, empfehlen wir für eine effiziente Verwaltung die Verwendung der Aspose.Total-Dokumentverarbeitungs-API.

Erkunden Dateiparser Optionen mit Python

Analysieren DOC Dateien (Microsoft Word-Binärformat)
Analysieren DOCX Dateien (Office 2007+ Word-Dokument)
Analysieren DOT Dateien (Microsoft Word-Vorlagendateien)
Analysieren DOTX Dateien (Microsoft Word-Vorlagendatei)
Analysieren ODP Dateien (OpenDocument-Präsentationsformat)
Analysieren ODT Dateien (OpenDocument-Textdateiformat)
Analysieren OTT Dateien (OpenDocument-Vorlage)
Analysieren PDF Dateien (Tragbares Dokumentformat)
Analysieren POWERPOINT Dateien (Präsentationsdateien)
Analysieren PPT Dateien (PowerPoint Präsentation)
Analysieren PPTX Dateien (Öffnen Sie das XML-Präsentationsformat)
Analysieren RTF Dateien (Rich-text-Format)
Analysieren WORD Dateien (Dateiformate für die Textverarbeitung)