Konvertieren Sie PDF mit Python in MHTML

Konvertierung von PDF in MHTML, HtmlFixed und HTML in Ihren Python-Anwendungen ohne Installation von Microsoft Word®.

 

Für einen Python-Entwickler, der versucht, eine PDF-zu-MHTML-Konvertierungsfunktion (Webarchivformat) hinzuzufügen, oder HtmlFixed bedeutet, dass er das Dokument im HTML-Format speichern möchte, indem er absolut positionierte Elemente innerhalb der Anwendung verwendet. Aspose.Total for Python via .NET API kann helfen, den Konvertierungsprozess zu automatisieren. Es ist ein vollständiges Paket verschiedener APIs, die unterschiedliche Formate verarbeiten.

Wir verwenden die Aspose.Words for Python via .NET -API, die Teil des Aspose.Total for Python via .NET -Pakets ist, um die PDF-zu-MHTML-Konvertierungsfunktion hinzuzufügen. Falls die PDF-Datei einfach ist, sind es nur zwei Codezeilen. Laden Sie die PDF-Datei und rufen Sie die save-Methode mit dem entsprechenden Dateipfad zusammen mit der SaveFormat-Enumeration als MHTML oder HTML_FIXED auf. Falls es jedoch erforderlich ist, das Dokumentmodell so nah wie möglich am Original wiederherzustellen, müssen einige zusätzliche Informationen im resultierenden Dokument gespeichert werden, die als Round-Trip-Informationen bezeichnet werden.

Wie man Konvertieren Sie PDF in MHTML in Python

  • Laden Sie die Quell-PDF-Datei mit der Klasse Document
  • Erstellen Sie die Instanz von HtmlSaveOptions
  • Setzen Sie export_roundtrip_information auf True
  • Geben Sie SaveFormat als MHTML an
  • Rufen Sie die Methode „save“ auf, während Sie den Pfad der Ausgabedatei und SaveFormat als Parameter angeben. Ihre PDF-Datei wird also unter dem angegebenen Pfad in MHTML konvertiert.

Konvertierungsanforderungen

  • Für die Konvertierung von PDF in das MHTML- oder HtmlFixed-Format ist Python 3.5 oder höher erforderlich
  • Referenz-APIs innerhalb des Projekts direkt von PyPI ( Aspose.Words )
  • Oder verwenden Sie die folgenden Pip-Befehle pip install aspose.words
  • Darüber hinaus überprüfen Microsoft Windows- oder Linux-basierte Betriebssysteme (siehe mehr für Words ) und für Linux die zusätzlichen Anforderungen für gcc und libpython und befolgen die Schritt-für-Schritt-Anweisungen von INSTALL
 

Speichern Sie PDF in MHTML in Python – ganz einfach

 
 

Konvertierung von PDF in MHTML in Python

 
PDF‑zu‑MHTML‑Konvertierung mit Python‑APIs hilft, Dokumentinhalte in ein Web‑Archivformat zu transformieren, das Markup und eingebettete Ressourcen in einer einzigen Datei kombiniert. Dadurch lässt sich PDF‑Information leichter bewahren, anzeigen oder in browserkompatiblen Umgebungen verteilen. Automatisierung erhöht den Nutzen dieser Konvertierung, indem sie die skalierbare Erstellung portabler, webbereiter Dateien aus statischen Dokumenten ermöglicht. Sie unterstützt die Veröffentlichung von Inhalten, Archivierung und die Integration mit Systemen, die selbstenthaltende Web‑Dokumentausgaben benötigen.

Wichtige Anwendungsfälle

  • Web‑Archiv‑Erstellung
    PDF‑Dateien in MHTML für browserbasierte Speicherung und Anzeige konvertieren.

  • Portables Dokumenten‑Publishing
    Dokumentinhalte in einem selbstenthaltenden, web‑freundlichen Format teilen.

  • Inhaltsbewahrung
    Visuelle und textuelle Informationen in einem Archiv bewahren, das für Web‑Workflows geeignet ist.

  • Systeminteroperabilität
    MHTML‑Ausgabe verwenden, wo der Dokumentenaustausch mit browserkompatiblen Standards übereinstimmen muss.

Automatisierungsszenarien

  • Automatisierte Web‑Konvertierungspipelines
    Python‑Skripte können PDFs in MHTML‑Dateien für digitale Veröffentlichungssysteme umwandeln.

  • Archivierungs‑Vertriebs‑Workflows
    Konvertierte Ausgaben können an Repositorien geliefert werden, die Web‑Archiv‑Inhalte verwalten.

  • Batch‑Dokumenten‑Publishing
    Große Mengen von PDFs können ohne manuelle Eingriffe in portable Web‑Dateien umgewandelt werden.

  • Dynamischer Inhaltsexport
    Systeme können MHTML‑Versionen von Dokumenten auf Abruf für das Teilen oder die Überprüfung erzeugen.

Erkunden Sie PDF Konvertierungs optionen mit Python

PDFs in EML konvertieren (E-Mail Nachricht)
PDFs in EMLX konvertieren (Apple-Mail-Nachricht)
PDFs in ICS konvertieren (Kalenderdatei)
PDFs in MBOX konvertieren (E-Mail-Postfachdatei)
PDFs in MSG konvertieren (Outlook-Nachrichtenelementdatei)
PDFs in OFT konvertieren (Outlook-Dateivorlage)
PDFs in OST konvertieren (Outlook-Offline-Speichertabelle)
PDFs in PST konvertieren (Persönliche Outlook-Speichertabelle)