Konvertiere MHTML in TXT über Python

Konvertierung von MHTML nach TXT Python. Programmierer können diesen Beispielcode verwenden, um MHTML nach TXT innerhalb eines beliebigen .NET Frameworks, .NET Core und PHP, VBScript, C++ über COM Interop zu exportieren.

Wandeln Sie MHTML in Python via .NET in TXT um

Wie konvertiert man MHTML in TXT? Mit einer modernen Python-API zur Dokumentverarbeitung können Sie Dokumente ganz einfach programmatisch vom Format MHTML in das Format TXT konvertieren. Mit nur wenigen Codezeilen konvertieren Sie Dateien in hoher Qualität. Die Aspose.PDF-Bibliothek ermöglicht es jedem Entwickler, MHTML in TXT mit Python einfach zu konvertieren.

Eine ausführlichere Beschreibung des Codeausschnitts und anderer möglicher Konvertierungsformate finden Sie in der Dokumentation. Sie können sich auch die anderen von unserer Bibliothek unterstützten Konvertierungen ansehen.

Mit der Bibliothek Aspose.PDF for Python via .NET können Sie MHTML programmatisch in TXT konvertieren. Die PDF-Software von Aspose ist ideal für Privatpersonen, kleine und große Unternehmen. Dank der Fähigkeit, große Datenmengen zu verarbeiten, können Sie die Konvertierung schnell und effizient durchführen und Ihre Daten schützen. Eine Besonderheit von Aspose.PDF ist die API zur Konvertierung von MHTML in TXT. Das Besondere an diesem Ansatz ist, dass Sie lediglich den Paketmanager von PyPI öffnen, nach „aspose-pdf“ suchen und die Software ohne spezielle, komplexe Einstellungen installieren müssen. Um die Vorteile der Bibliothek zu testen, verwenden Sie den Codeausschnitt zur Konvertierung von MHTML in TXT. Sie können auch den folgenden Befehl von der Konsole oder dem Terminal aus verwenden:

Console

pip install aspose-pdf

So konvertieren Sie MHTML in TXT


Python via .NET Entwickler können einfach MHTML Dateien in nur wenigen Codezeilen laden und in TXT konvertieren.

  1. Importieren Sie die erforderlichen Module aus der aspose.pdf-Bibliothek, einschließlich der Dokumentklasse zum Laden von PDF-Dateien.Sichern Sie sich, dass die erforderlichen Bibliotheken installiert und importiert werden, bevor Sie fortfahren.
  2. Geben Sie den Pfad zum Eingabe-PDF-Dokument an, indem Sie indi mit infile verbinden, um die richtige Verzeichnisstruktur zu gewährleisten.Dieser Schritt ist entscheidend, um die Eingabedatei richtig innerhalb des angegebenen Verzeichnisbaums zu finden.
  3. Erstellen Sie eine Instanz der MhtLoadOptions-Klasse, um das Ausgabeformat für das Speichern von Dokumenten anzugeben.Diese Optionen steuern die Eigenschaften der konvertierten HTML-Datei.MhtLoadOptions wird verwendet, um das Verhalten des Konvertierungsprozesses zu konfigurieren.
  4. Laden Sie das eingehende PDF-Dokument in ein Dokumentobjekt mithilfe von apdf.Document().Das geladene Dokument wird zur Verarbeitung und Speicherung in andere Formate verwendet.
  5. Holen Sie die Gesamtzahl der Seiten im geladenen PDF-Dokument mithilfe der len()-Funktion ab.Dieser Schritt enthält wichtige Informationen über den Inhalt und das Layout der Eingabedatei.
  6. Erstellen Sie eine Instanz der TextDevice-Klasse, um die Art des Geräts anzuzeigen, das für die Verarbeitung des Dokuments verwendet wird, einschließlich seiner Auflösung, Farbtiefe und anderen Einstellungen.Das ausgewählte Gerät beeinflusst die Qualität und das Aussehen der erzeugten Ausgabedatei.
  7. Verwenden Sie das definierte Gerät, um eine einzelne Seite aus dem geladenen PDF-Dokument zu verarbeiten und das konvertierte Bild auf dem angegebenen Ausgangspfad zu speichern.
  8. Drucken Sie eine Erfolgsmeldung aus, die angibt, dass die Konvertierung abgeschlossen ist, nachdem das konvertierte Dokument gespeichert wurde.Dieser Schritt bestätigt, dass der Konvertierungsprozess erfolgreich war und die Ausgabedateien auf den angegebenen Wegen gefunden werden können.

Hier ist ein Beispiel, das zeigt, wie man MHTML in TXT in Python konvertiert. Sie können diesen einfachen Schritten folgen, um Ihre MHTML -Datei in das Format TXT zu konvertieren. Laden Sie zuerst Ihre MHTML -Datei hoch und speichern Sie sie dann einfach als TXT -Datei. Sie können vollqualifizierte Dateinamen sowohl für das Lesen von MHTML als auch für das Schreiben von TXT verwenden. Inhalt und Formatierung der Ausgabe von TXT werden mit dem Originaldokument von MHTML identisch sein.

Beispiel: MHTML über Python in TXT konvertieren

Dieser Beispielcode zeigt die Konvertierung von MHTML in TXT Python

Input file:

File not added

Output format:

TXT

Output file:

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

load_options = apdf.MhtLoadOptions()
document = apdf.Document(path_infile, load_options)
print(len(document.pages))
device = apdf.devices.TextDevice()
device.process(document.pages[1], path_outfile)

print(infile + " converted into " + outfile)

Konvertiere MHTML in TXT mit Python via .NET

Aspose.PDF for Python über .NET-API unterstützt die meisten gängigen PDF-Standards und PDF-Spezifikationen. Es ermöglicht Entwicklern, Tabellen, Grafiken, Bilder, Hyperlinks, benutzerdefinierte Schriftarten — und mehr — in PDF-Dokumente einzufügen. Darüber hinaus ist es auch möglich, PDF-Dokumente zu komprimieren. Aspose.PDF for Python via.NET bietet hervorragende Sicherheitsfunktionen für die Entwicklung sicherer PDF-Dokumente. Zu den wichtigsten Funktionen von Aspose.PDF for Python über .NET-API gehören:

  • Möglichkeit, PDF in verschiedenen Bildformaten wie BMP, GIF, JPEG und PNG zu lesen und zu exportieren.
  • Legen Sie grundlegende Informationen (z. B. Autor, Ersteller) des PDF-Dokuments fest.
  • Konvertierungsfunktionen: Konvertieren Sie PDF in Word, Excel und PowerPoint. Konvertiert PDF in Bildformate. Konvertiert die PDF-Datei in das HTML-Format und umgekehrt. Konvertieren Sie PDF in EPUB, Text, XPS usw.

Weitere Informationen zu Aspose.PDF for Python via .NET API finden Sie in unserer Dokumentation zur Verwendung der API.