Konvertieren Sie DOC mit Python in MHTML

Konvertierung von DOC in MHTML, HtmlFixed und HTML in Ihren Python-Anwendungen ohne Installation von Microsoft Word®.

 

Für einen Python-Entwickler, der versucht, eine DOC-zu-MHTML-Konvertierungsfunktion (Webarchivformat) hinzuzufügen, oder HtmlFixed bedeutet, dass er das Dokument im HTML-Format speichern möchte, indem er absolut positionierte Elemente innerhalb der Anwendung verwendet. Aspose.Total for Python via .NET API kann helfen, den Konvertierungsprozess zu automatisieren. Es ist ein vollständiges Paket verschiedener APIs, die unterschiedliche Formate verarbeiten.

Wir verwenden die Aspose.Words for Python via .NET -API, die Teil des Aspose.Total for Python via .NET -Pakets ist, um die DOC-zu-MHTML-Konvertierungsfunktion hinzuzufügen. Falls die DOC-Datei einfach ist, sind es nur zwei Codezeilen. Laden Sie die DOC-Datei und rufen Sie die save-Methode mit dem entsprechenden Dateipfad zusammen mit der SaveFormat-Enumeration als MHTML oder HTML_FIXED auf. Falls es jedoch erforderlich ist, das Dokumentmodell so nah wie möglich am Original wiederherzustellen, müssen einige zusätzliche Informationen im resultierenden Dokument gespeichert werden, die als Round-Trip-Informationen bezeichnet werden.

Wie man Konvertieren Sie DOC in MHTML in Python

  • Laden Sie die Quell-DOC-Datei mit der Klasse Document
  • Erstellen Sie die Instanz von HtmlSaveOptions
  • Setzen Sie export_roundtrip_information auf True
  • Geben Sie SaveFormat als MHTML an
  • Rufen Sie die Methode „save“ auf, während Sie den Pfad der Ausgabedatei und SaveFormat als Parameter angeben. Ihre DOC-Datei wird also unter dem angegebenen Pfad in MHTML konvertiert.

Konvertierungsanforderungen

  • Für die Konvertierung von DOC in das MHTML- oder HtmlFixed-Format ist Python 3.5 oder höher erforderlich
  • Referenz-APIs innerhalb des Projekts direkt von PyPI ( Aspose.Words )
  • Oder verwenden Sie die folgenden Pip-Befehle pip install aspose.words
  • Darüber hinaus überprüfen Microsoft Windows- oder Linux-basierte Betriebssysteme (siehe mehr für Words ) und für Linux die zusätzlichen Anforderungen für gcc und libpython und befolgen die Schritt-für-Schritt-Anweisungen von INSTALL
 

Speichern Sie DOC in MHTML in Python – ganz einfach

 
 

Konvertierung von DOC in MHTML in Python

 

Erkunden Sie DOC Konvertierungs optionen mit Python

DOCs in CSV konvertieren (Durch Kommas getrennte Werte)
DOCs in DIF konvertieren (Datenaustauschformat)
DOCs in EML konvertieren (E-Mail Nachricht)
DOCs in EMLX konvertieren (Apple-Mail-Nachricht)
DOCs in EXCEL konvertieren (Tabellenkalkulationsdateiformate)
DOCs in FODS konvertieren (OpenDocument Flat XML-Tabelle)
DOCs in ICS konvertieren (Kalenderdatei)
DOCs in MBOX konvertieren (E-Mail-Postfachdatei)
DOCs in MSG konvertieren (Outlook-Nachrichtenelementdatei)
DOCs in ODP konvertieren (OpenDocument-Präsentationsformat)
DOCs in ODS konvertieren (OpenDocument-Tabelle)
DOCs in OFT konvertieren (Outlook-Dateivorlage)
DOCs in OST konvertieren (Outlook-Offline-Speichertabelle)
DOCs in POT konvertieren (Microsoft PowerPoint-Vorlagendateien)
DOCs in POTM konvertieren (Microsoft PowerPoint-Vorlagendatei)
DOCs in POTX konvertieren (Microsoft PowerPoint-Vorlagenpräsentation)
DOCs in POWERPOINT konvertieren (Präsentationsdateien)
DOCs in PPS konvertieren (PowerPoint-Diashow)
DOCs in PPSM konvertieren (Makrofähige Diashow)
DOCs in PPSX konvertieren (PowerPoint-Diashow)
DOCs in PPT konvertieren (PowerPoint Präsentation)
DOCs in PPTM konvertieren (Makrofähige Präsentationsdatei)
DOCs in PPTX konvertieren (Öffnen Sie das XML-Präsentationsformat)
DOCs in PST konvertieren (Persönliche Outlook-Speichertabelle)
DOCs in SXC konvertieren (StarOffice Calc-Tabelle)
DOCs in TSV konvertieren (Durch Tabulatoren getrennte Werte)
DOCs in XLAM konvertieren (Excel-Makro-fähiges Add-In)
DOCs in XLS konvertieren (Microsoft Excel-Binärformat)
DOCs in XLSB konvertieren (Excel-Binärarbeitsmappe)
DOCs in XLSM konvertieren (Makrofähige Tabellenkalkulation)
DOCs in XLSX konvertieren (Öffnen Sie die XML-Arbeitsmappe)
DOCs in XLT konvertieren (Excel 97 - 2003-Vorlage)
DOCs in XLTM konvertieren (Excel-Makro-fähige Vorlage)

Was ist DOC Dateiformat

Das Microsoft Word Binary File Format (DOC) ist ein proprietäres Dokumentdateiformat, das von Microsoft Office Word verwendet wird. Es stellt eine Dokumentstruktur dar, die unabhängig von einer bestimmten Computerarchitektur oder einem bestimmten Betriebssystem ist. Das DOC-Format dient als Containerdatei und nutzt ein Binärformat zum Speichern verschiedener Datentypen, darunter formatierter Text, Bilder, Diagramme und mehr. Die binäre Natur des DOC-Formats macht es nicht für Menschen lesbar, aber es gibt mehrere Programme, wie Microsoft Word und LibreOffice, die sowohl aus DOC-Dateien lesen als auch in diese schreiben können.

Das DOC-Format war ursprünglich wurde 1987 in Word für Windows 2.0 eingeführt. Seitdem wurde es mehrfach überarbeitet, wobei die jüngste Version das Office Open XML-Format ist, das in Office 2007 eingeführt wurde. Einer der Hauptvorteile des DOC-Formats liegt in seiner Kompatibilität mit Microsoft Word , eine der am weitesten verbreiteten Textverarbeitungsanwendungen weltweit. Diese Kompatibilität ermöglicht es Benutzern, Dokumente mit Microsoft Word zu erstellen und zu ändern und sie bequem mit anderen zu teilen, die die Anwendung ebenfalls verwenden. Darüber hinaus verfügen viele andere Textverarbeitungsanwendungen über die Fähigkeit, das DOC-Format zu lesen und in dieses zu schreiben, was es zu einer vielseitigen Wahl für die gemeinsame Nutzung von Dokumenten macht.

Die weite Verbreitung des DOC-Formats ist auf seine Integration mit Microsoft Word zurückzuführen und bietet Benutzern eine robuste und funktionsreiche Umgebung zum Erstellen und Verwalten von Dokumenten. Die Flexibilität des Formats geht über die von Microsoft Word hinaus und ermöglicht Benutzern die Arbeit mit DOC-Dateien mit alternativer Textverarbeitungssoftware. Diese Vielseitigkeit gewährleistet eine nahtlose Zusammenarbeit und Austauschbarkeit von Dokumenten zwischen Benutzern, unabhängig von der gewählten Textverarbeitungsanwendung.

Was ist MHTML Dateiformat

MHTML, kurz für MIME HTML, ist ein Dateiformat, das HTML-Code und die zugehörigen Ressourcen in einer einzigen Datei kombiniert. Es steht für Multipurpose Internet Mail Extension HTML. MHTML-Dateien werden häufig zum Speichern von Webseiten einschließlich ihres gesamten Inhalts wie Bildern, CSS-Stylesheets und JavaScript in einer einzigen Datei verwendet.

MHTML-Dateien werden häufig von Webbrowsern erstellt, wenn Benutzer Webseiten offline speichern Ansichts- oder Archivierungszwecke. Durch die Bündelung aller notwendigen Ressourcen in einer Datei stellt MHTML sicher, dass die Webseite auch ohne Internetverbindung oder Zugriff auf den ursprünglichen Server korrekt angezeigt und gerendert werden kann.

Das MHTML-Format folgt dem MIME-Standard, der dient der Verschlüsselung und dem Austausch verschiedener Arten von Daten über das Internet. Es nutzt die mehrteilige MIME-Codierung, um den HTML-Code und die zugehörigen Ressourcen in einer einzigen Datei zu packen. Die Datei hat normalerweise die Dateierweiterung .mht oder .mhtml.

MHTML-Dateien können von Webbrowsern geöffnet und angezeigt werden, die das Format unterstützen, z. B. Internet Explorer, Microsoft Edge und Opera. Einige Texteditoren und spezielle Software bieten auch die Möglichkeit, MHTML-Dateien zu öffnen und zu bearbeiten.

Das MHTML-Format bietet Vorteile in Bezug auf Portabilität und Komfort, da es Benutzern ermöglicht, Webseiten als einzelne Datei zu speichern und zu teilen. Gewährleistung der Beibehaltung des Layouts, der Formatierung und der verknüpften Ressourcen der Seite. Es ist jedoch zu beachten, dass MHTML nicht so weit verbreitet ist wie andere Webformate wie HTML oder PDF und die Kompatibilität je nach Software und Plattform unterschiedlich sein kann.