Konvertera DOC till MHTML med Python

DOC till MHTML, HtmlFixed och HTML-konvertering i dina Python-applikationer utan att installera Microsoft Word®.

 

För en Python-utvecklare, som försöker lägga till en konverteringsfunktion för DOC till MHTML (Web archive format) eller HTMLFixed, vill spara dokumentet i HTML-format med hjälp av absolut placerade element i applikationen. Aspose.Total for Python via .NET API kan hjälpa till att automatisera konverteringsprocessen. Det är ett komplett paket med olika API:er som hanterar olika format.

Vi använder Aspose.Words for Python via .NET API som är en del av Aspose.Total for Python via .NET Package för att lägga till DOC till MHTML-konverteringsfunktionen. Om DOC-filen är enkel är det bara två rader kod. Ladda DOC-filen och anropa sparmetoden med lämplig filsökväg tillsammans med SaveFormat-uppräkning som MHTML eller HTML_FIXED. Men om det finns ett behov av att återställa dokumentmodellen så nära den ursprungliga, så finns det behov av att spara lite extra information i det resulterande dokumentet som kallas tur- och returinformation.

Hur Konvertera DOC till MHTML i Python

  • Ladda käll-DOC-fil med Document -klassen
  • Skapa instansen av HtmlSaveOptions
  • Ställ in export_roundtrip_information som Sant
  • Ange SaveFormat som MHTML
  • Anropa ‘spara’-metoden samtidigt som du anger sökvägen för utdatafilen och SaveFormat som parametrar. Så din DOC-fil konverteras till MHTML på den angivna sökvägen.

Konverteringskrav

  • För konvertering av DOC till MHTML eller HtmlFixed format krävs Python 3.5 eller senare
  • Referera API:er inom projektet direkt från PyPI ( Aspose.Words )
  • Eller använd följande pip-kommandon pip install aspose.words
  • Dessutom, Microsoft Windows eller Linux-baserade OS (se mer för Words ) och för Linux kontrollera ytterligare krav för gcc och libpython och följ steg-för-steg-instruktionerna INSTALL
 

Spara DOC till MHTML i Python - Enkelt

 
 

DOC till MHTML-konvertering i Python

 

Explore DOC Conversion Options with Python

Konvertera DOCs till CSV (Comma Seperated Values)
Konvertera DOCs till DIF (Data Interchange Format)
Konvertera DOCs till EML (E-Mail Message)
Konvertera DOCs till EMLX (Apple Mail Message)
Konvertera DOCs till EXCEL (Spreadsheet File Formats)
Konvertera DOCs till FODS (OpenDocument Flat XML Spreadsheet)
Konvertera DOCs till ICS (Calendar File)
Konvertera DOCs till MBOX (Email Mailbox File)
Konvertera DOCs till MSG (Outlook Message Item File)
Konvertera DOCs till ODP (OpenDocument Presentation Format)
Konvertera DOCs till ODS (OpenDocument Spreadsheet)
Konvertera DOCs till OFT (Outlook File Template)
Konvertera DOCs till OST (Outlook Offline Data File)
Konvertera DOCs till POT (Microsoft PowerPoint Template Files)
Konvertera DOCs till POTM (Microsoft PowerPoint Template File)
Konvertera DOCs till POTX (Microsoft PowerPoint Template Presentation)
Konvertera DOCs till PPS (PowerPoint Slide Show)
Konvertera DOCs till PPSM (Macro-enabled Slide Show)
Konvertera DOCs till PPSX (PowerPoint Slide Show)
Konvertera DOCs till PPT (Microsoft PowerPoint 97-2003)
Konvertera DOCs till PPTM (Macro-enabled Presentation File)
Konvertera DOCs till PPTX (Open XML presentation Format)
Konvertera DOCs till PST (Outlook Personal Information Store File)
Konvertera DOCs till SXC (StarOffice Calc Spreadsheet)
Konvertera DOCs till TSV (Tab Seperated Values)
Konvertera DOCs till XLAM (Excel Macro-Enabled Add-In)
Konvertera DOCs till XLS (Microsoft Excel Spreadsheet (Legacy))
Konvertera DOCs till XLSB (Excel Binary Workbook)
Konvertera DOCs till XLSM (Macro-enabled Spreadsheet)
Konvertera DOCs till XLSX (Open XML Workbook)
Konvertera DOCs till XLT (Excel 97 - 2003 Template)
Konvertera DOCs till XLTM (Excel Macro-Enabled Template)
Konvertera DOCs till XLTX (Excel Template)

Vad är DOC filformatet

Microsoft Word Binary File Format (DOC) är ett proprietärt dokumentfilformat som används av Microsoft Office Word. Det är ett binärt filformat som representerar ett dokument i en struktur som är oberoende av någon speciell datorarkitektur eller operativsystem. DOC-formatet är en containerfil som lagrar data i ett binärt format. En DOC-fil kan innehålla en mängd olika datatyper, inklusive formaterad text, bilder, diagram och andra data. Det binära formatet för en DOC-fil är inte avsett att vara läsbart för människor. Det finns dock ett antal program som kan läsa och skriva DOC-filer, inklusive Microsoft Word och LibreOffice. DOC-formatet introducerades först i Word för Windows 2.0 1987. Det har sedan dess reviderats flera gånger, där den senaste versionen är Office Open XML-formatet som introducerades i Office 2007. En av de viktigaste fördelarna med DOC-formatet är dess kompatibilitet med Microsoft Word, som är ett av de mest använda ordbehandlingsprogrammen i världen. Detta tillåter användare att skapa och redigera dokument i Microsoft Word och sedan dela dem med andra som också använder programmet. Dessutom kan många andra ordbehandlingsprogram också läsa och skriva DOC-formatet, vilket gör det till ett mångsidigt format för dokumentdelning.

Vad är MHTML filformatet

MHTML, förkortning för MIME HTML, är ett webbsidearkivformat som används för att kombinera resurser som vanligtvis representeras av externa länkar (som bilder, Flash-animationer, Java-applets och ljudfiler) med HTML-kod till en enda fil. Den resulterande filen kan sparas och öppnas av webbläsare.MHTML stöds av de flesta större webbläsare, inklusive Microsoft Edge, Internet Explorer, Google Chrome, Mozilla Firefox och Opera. Safari har begränsat stöd för MHTML. När en webbsida sparas som en MHTML-fil kodas HTML-koden och resurserna vanligtvis med MIME-typen multipart/related. Denna typ av kodning är nödvändig för att upprätthålla korrekt sekvens av HTML-koden och resurserna när de kombineras till en enda fil. MHTML-formatet används ofta för att arkivera webbsidor eller för att distribuera webbsidor som behöver ses offline.