Converteer DOC naar MHTML met Python

DOC naar MHTML, HtmlFixed en HTML-conversie in uw Python-applicaties zonder Microsoft Word® te installeren.

 

Voor een Python-ontwikkelaar die probeert een DOC naar MHTML-conversiefunctie (Webarchiefformaat) of HtmlFixed toe te voegen, wil hij het document in het HTML-formaat opslaan met absoluut gepositioneerde elementen binnen de applicatie. Aspose.Total for Python via .NET API kan helpen om het conversieproces te automatiseren. Het is een volledig pakket van verschillende API’s die verschillende formaten behandelen.

We gebruiken Aspose.Words for Python via .NET API die deel uitmaakt van Aspose.Total for Python via .NET Package om de DOC-naar-MHTML-conversiefunctie toe te voegen. Als het DOC-bestand eenvoudig is, zijn het slechts twee regels code. Laad het DOC-bestand en roep de opslagmethode aan met het juiste bestandspad samen met SaveFormat-opsomming als MHTML of HTML_FIXED. Maar als het documentmodel zo dicht mogelijk bij het origineel moet worden hersteld, moet er wat extra informatie worden opgeslagen in het resulterende document, retourinformatie genaamd.

Hoe Converteer DOC naar MHTML in Python

  • Laad het DOC-bronbestand met de klasse Document
  • Maak de instantie van HtmlSaveOptions
  • Stel de export_roundtrip_information in op True
  • Specificeer de SaveFormat als MHTML
  • Roep de save-methode aan terwijl u het pad van het uitvoerbestand en SaveFormat opgeeft als parameters. Dus uw DOC-bestand wordt geconverteerd naar MHTML op het opgegeven pad.

Conversievereisten

  • Voor conversie van DOC naar MHTML of Html Vaste indeling is Python 3.5 of hoger vereist
  • Referentie-API’s binnen het project rechtstreeks vanuit PyPI ( Aspose.Words )
  • Of gebruik de volgende pip-commando’s pip install aspose.words
  • Bovendien, op Microsoft Windows of Linux gebaseerd besturingssysteem (zie meer voor Words ) en voor Linux, controleer de aanvullende vereisten voor gcc en libpython en volg de stapsgewijze instructies INSTALL
 

DOC opslaan in MHTML in Python - Eenvoudig

 
 

DOC naar MHTML-conversie in Python

 

Bekijk DOC conversieopties met Python

DOCs converteren naar CSV (Door komma's gescheiden waarden)
DOCs converteren naar DIF (Formaat voor gegevensuitwisseling)
DOCs converteren naar EMAIL (E-mail bestanden)
DOCs converteren naar EMLX (Apple Mail-bericht)
DOCs converteren naar EXCEL (Spreadsheet-bestandsindelingen)
DOCs converteren naar FODS (OpenDocument platte XML-spreadsheet)
DOCs converteren naar ICS (Kalender Bestand)
DOCs converteren naar MBOX (E-mail mailboxbestand)
DOCs converteren naar MSG (Outlook-berichtitembestand)
DOCs converteren naar ODP (OpenDocument-presentatieformaat)
DOCs converteren naar ODS (OpenDocument-spreadsheet)
DOCs converteren naar OFT (Outlook-bestandssjabloon)
DOCs converteren naar OST (Outlook offline opslagtabel)
DOCs converteren naar POT (Microsoft PowerPoint-sjabloonbestanden)
DOCs converteren naar POTM (Microsoft PowerPoint-sjabloonbestand)
DOCs converteren naar POTX (Microsoft PowerPoint-sjabloonpresentatie)
DOCs converteren naar POWERPOINT (Presentatie bestanden)
DOCs converteren naar PPS (PowerPoint-diavoorstelling)
DOCs converteren naar PPSM (Diavoorstelling met macro's)
DOCs converteren naar PPSX (PowerPoint-diavoorstelling)
DOCs converteren naar PPT (PowerPoint presentatie)
DOCs converteren naar PPTM (Presentatiebestand met ingeschakelde macro's)
DOCs converteren naar PPTX (Open XML-presentatieformaat)
DOCs converteren naar PST (Outlook persoonlijke opslagtabel)
DOCs converteren naar SXC (StarOffice Calc-spreadsheet)
DOCs converteren naar TSV (Door tabs gescheiden waarden)
DOCs converteren naar XLAM (Excel-invoegtoepassing met ingeschakelde macro's)
DOCs converteren naar XLS (Microsoft Excel binair formaat)
DOCs converteren naar XLSB (Excel binaire werkmap)
DOCs converteren naar XLSM (Spreadsheet met ingeschakelde macro's)
DOCs converteren naar XLSX (XML-werkmap openen)
DOCs converteren naar XLT (Excel 97 - 2003-sjabloon)
DOCs converteren naar XLTM (Excel-sjabloon met ingeschakelde macro's)

Wat is DOC bestandsformaat

De Microsoft Word Binary File Format (DOC) is een bedrijfseigen documentbestandsindeling die wordt gebruikt door Microsoft Office Word. Het vertegenwoordigt een documentstructuur die onafhankelijk is van een specifieke computerarchitectuur of besturingssysteem. Het DOC-formaat dient als een containerbestand en gebruikt een binair formaat om verschillende soorten gegevens op te slaan, waaronder opgemaakte tekst, afbeeldingen, grafieken en meer. De binaire aard van het DOC-formaat maakt het niet leesbaar voor mensen, maar er bestaan verschillende programma’s, zoals Microsoft Word en LibreOffice, die zowel kunnen lezen van als schrijven naar DOC-bestanden.

Het DOC-formaat was aanvankelijk geïntroduceerd in Word voor Windows 2.0 in 1987. Het heeft sindsdien verschillende herzieningen ondergaan, met als meest recente iteratie het Office Open XML-formaat geïntroduceerd in Office 2007. Een van de belangrijkste voordelen van het DOC-formaat ligt in de compatibiliteit met Microsoft Word , een van de meest gebruikte tekstverwerkingsprogramma’s ter wereld. Door deze compatibiliteit kunnen gebruikers documenten maken en wijzigen met behulp van Microsoft Word en deze gemakkelijk delen met anderen die de applicatie ook gebruiken. Bovendien hebben veel andere tekstverwerkingsprogramma’s de mogelijkheid om te lezen van en te schrijven naar het DOC-formaat, waardoor het een veelzijdige keuze is voor het delen van documenten.

De wijdverbreide acceptatie van het DOC-formaat komt voort uit de integratie met Microsoft Word , waarmee gebruikers een robuuste en functierijke omgeving krijgen voor het maken en beheren van documenten. De flexibiliteit van het formaat gaat verder dan Microsoft Word, waardoor gebruikers met DOC-bestanden kunnen werken met behulp van alternatieve tekstverwerkingssoftware. Deze veelzijdigheid zorgt voor naadloze documentsamenwerking en uitwisselbaarheid tussen gebruikers, ongeacht de gekozen tekstverwerkingstoepassing.

Wat is MHTML bestandsformaat

MHTML, een afkorting van MIME HTML, is een bestandsindeling die HTML-code en de bijbehorende bronnen combineert in één bestand. Het staat voor Multipurpose Internet Mail Extension HTML. MHTML-bestanden worden vaak gebruikt voor het opslaan van webpagina’s, inclusief al hun inhoud, zoals afbeeldingen, CSS-stylesheets en JavaScript, in één bestand.

MHTML-bestanden worden vaak gemaakt door webbrowsers wanneer gebruikers webpagina’s opslaan voor offline weergave- of archiveringsdoeleinden. Door alle benodigde bronnen in één bestand te bundelen, zorgt MHTML ervoor dat de webpagina nauwkeurig kan worden bekeken en weergegeven, zelfs zonder internetverbinding of toegang tot de oorspronkelijke server.

Het MHTML-formaat volgt de MIME-standaard, die wordt gebruikt voor het coderen en uitwisselen van verschillende soorten gegevens via internet. Het gebruikt meerdelige MIME-codering om de HTML-code en bijbehorende bronnen in één bestand te verpakken. Het bestand heeft meestal de bestandsextensie .mht of .mhtml.

MHTML-bestanden kunnen worden geopend en bekeken door webbrowsers die de indeling ondersteunen, zoals Internet Explorer, Microsoft Edge en Opera. Sommige teksteditors en gespecialiseerde software bieden ook de mogelijkheid om MHTML-bestanden te openen en te bewerken.

Het MHTML-formaat biedt voordelen op het gebied van draagbaarheid en gemak, omdat gebruikers hiermee webpagina’s kunnen opslaan en delen als een enkel bestand, zorgen voor het behoud van de lay-out, opmaak en gekoppelde bronnen van de pagina. Het is echter vermeldenswaard dat MHTML niet zo veel wordt gebruikt als andere webformaten zoals HTML of PDF, en dat de compatibiliteit per software en platform kan verschillen.