Převeďte DOC na MHTML pomocí Pythonu

Převod DOC na MHTML, HtmlFixed a HTML ve vašich aplikacích Python bez instalace Microsoft Word®.

 

Pro vývojáře Pythonu, který se snaží přidat funkci převodu DOC na MHTML (formát webového archivu) nebo HtmlFixed, znamená chtít uložit dokument ve formátu HTML pomocí absolutně umístěných prvků v aplikaci. Aspose.Total for Python via .NET API může pomoci automatizovat proces převodu. Je to plný balík různých API zabývajících se různými formáty.

K přidání funkce převodu DOC na MHTML používáme API Aspose.Words for Python via .NET , které je součástí balíčku Aspose.Total for Python via .NET . V případě, že je soubor DOC jednoduchý, pak jsou to jen dva řádky kódu. Načtěte soubor DOC a zavolejte metodu uložení s příslušnou cestou k souboru spolu s výčtem SaveFormat jako MHTML nebo HTML_FIXED. Ale v případě, že je potřeba obnovit model dokumentu co nejblíže původnímu, je potřeba do výsledného dokumentu uložit nějaké extra informace, tzv. round-trip information.

Jak Převeďte DOC na MHTML v Pythonu

  • Načtěte zdrojový soubor DOC pomocí třídy Document
  • Vytvořte instanci HtmlSaveOptions
  • Nastavte export_roundtrip_information jako True
  • Zadejte SaveFormat jako MHTML
  • Zavolejte metodu save, přičemž jako parametry zadejte cestu k výstupnímu souboru a SaveFormat. Váš soubor DOC je tedy převeden na MHTML na zadané cestě.

Požadavky na konverzi

  • Pro převod formátu DOC na MHTML nebo HtmlFixed je vyžadován Python 3.5 nebo novější
  • Referenční API v rámci projektu přímo z PyPI ( Aspose.Words )
  • Nebo použijte následující příkazy pip pip install aspose.words
  • Kromě toho operační systém založený na Microsoft Windows nebo Linux (viz více Words ) a pro Linux zkontrolujte další požadavky pro gcc a libpython a postupujte podle pokynů INSTALL krok za krokem.
 

Uložit DOC do MHTML v Pythonu – jednoduché

 
 

Převod DOC do MHTML v Pythonu

 

Prozkoumat možnosti konverzace DOC pomocí Python

Převést DOCs na CSV (Hodnoty oddělené čárkami)
Převést DOCs na DIF (Formát výměny dat)
Převést DOCs na EXCEL (Formáty tabulkových souborů)
Převést DOCs na FODS (OpenDocument Flat XML tabulka)
Převést DOCs na ODS (Tabulka OpenDocument)
Převést DOCs na SXC (Tabulka StarOffice Calc)
Převést DOCs na TSV (Hodnoty oddělené tabulátorem)
Převést DOCs na XLAM (Doplněk Excel s podporou maker)
Převést DOCs na XLS (Binární formát Microsoft Excel)
Převést DOCs na XLSB (Binární sešit Excel)
Převést DOCs na XLSM (Tabulka s podporou maker)
Převést DOCs na XLSX (Otevřete sešit XML)
Převést DOCs na XLT (Šablona Excel 97 - 2003)
Převést DOCs na XLTM (Šablona s podporou maker aplikace Excel)
Převést DOCs na XLTX (Excel šablona)
Převést DOCs na EMAIL (Soubory e-mailu)
Převést DOCs na EML (E-mailová zpráva)
Převést DOCs na EMLX (Apple Mail Message)
Převést DOCs na ICS (Soubor kalendáře)
Převést DOCs na MBOX (Soubor e-mailové schránky)
Převést DOCs na MSG (Soubor položky zprávy aplikace Outlook)
Převést DOCs na ODP (Formát prezentace OpenDocument)
Převést DOCs na OFT (Šablona souboru aplikace Outlook)
Převést DOCs na OST (Tabulka offline úložiště aplikace Outlook)
Převést DOCs na POT (Soubory šablon aplikace Microsoft PowerPoint)
Převést DOCs na POTM (Soubor šablony Microsoft PowerPoint)
Převést DOCs na POTX (Prezentace šablony Microsoft PowerPoint)
Převést DOCs na POWERPOINT (Prezentační soubory)
Převést DOCs na PPS (Prezentace PowerPoint)
Převést DOCs na PPSM (Prezentace s podporou maker)
Převést DOCs na PPSX (Prezentace PowerPoint)
Převést DOCs na PPT (Prezentace v Powerpointu)
Převést DOCs na PPTM (Soubor prezentace s podporou maker)
Převést DOCs na PPTX (Formát otevřené prezentace XML)
Převést DOCs na PST (Tabulka osobního úložiště aplikace Outlook)
Převést DOCs na VCF (Soubor vCard)

Co je formát DOC

Microsoft Word Binary File Format (DOC) je proprietární formát souboru dokumentu používaný aplikací Microsoft Office Word. Představuje strukturu dokumentu, která je nezávislá na jakékoli konkrétní počítačové architektuře nebo operačním systému. Formát DOC slouží jako kontejnerový soubor využívající binární formát k ukládání různých typů dat, včetně formátovaného textu, obrázků, grafů a dalších. Binární povaha formátu DOC jej činí nečitelným pro člověka, ale existuje několik programů, jako je Microsoft Word a LibreOffice, které dokážou číst ze souborů DOC i zapisovat do nich.

Formát DOC byl původně představen ve Wordu pro Windows 2.0 již v roce 1987. Od té doby prošel několika revizemi, přičemž poslední iterací je formát Office Open XML představený v Office 2007. Jednou z klíčových výhod formátu DOC je jeho kompatibilita s Microsoft Word , jedna z celosvětově nejrozšířenějších aplikací pro zpracování textu. Tato kompatibilita umožňuje uživatelům vytvářet a upravovat dokumenty pomocí aplikace Microsoft Word a pohodlně je sdílet s ostatními, kteří tuto aplikaci také využívají. Kromě toho má mnoho dalších aplikací pro zpracování textu schopnost číst z formátu DOC a zapisovat do něj, což z něj činí všestrannou volbu pro účely sdílení dokumentů.

Široce rozšířené přijetí formátu DOC pramení z jeho integrace s Microsoft Word , poskytující uživatelům robustní a na funkce bohaté prostředí pro vytváření a správu dokumentů. Flexibilita formátu přesahuje Microsoft Word a umožňuje uživatelům pracovat se soubory DOC pomocí alternativního softwaru pro zpracování textu. Tato všestrannost zajišťuje bezproblémovou spolupráci na dokumentech a zaměnitelnost mezi uživateli, bez ohledu na jejich zvolenou aplikaci pro zpracování textu.

Co je formát MHTML

MHTML, zkratka pro MIME HTML, je formát souboru, který kombinuje HTML kód a jeho přidružené zdroje do jednoho souboru. Je to zkratka pro Multipurpose Internet Mail Extension HTML. Soubory MHTML se běžně používají k ukládání webových stránek, včetně veškerého jejich obsahu, jako jsou obrázky, šablony stylů CSS a JavaScript, do jednoho souboru.

Soubory MHTML často vytvářejí webové prohlížeče, když uživatelé ukládají webové stránky pro offline účely prohlížení nebo archivace. Spojením všech nezbytných zdrojů do jednoho souboru MHTML zajišťuje, že webovou stránku lze přesně zobrazit a vykreslit i bez připojení k internetu nebo přístupu k původnímu serveru.

Formát MHTML se řídí standardem MIME, který se používá pro kódování a výměnu různých typů dat přes internet. Používá vícedílné kódování MIME k zabalení kódu HTML a souvisejících zdrojů do jednoho souboru. Soubor má obvykle příponu .mht nebo .mhtml.

Soubory MHTML lze otevřít a prohlížet webovými prohlížeči, které tento formát podporují, jako je Internet Explorer, Microsoft Edge a Opera. Některé textové editory a specializovaný software také umožňují otevírat a upravovat soubory MHTML.

Formát MHTML nabízí výhody z hlediska přenositelnosti a pohodlí, protože uživatelům umožňuje ukládat a sdílet webové stránky jako jeden soubor, zajištění zachování rozvržení stránky, formátování a propojených zdrojů. Je však třeba poznamenat, že MHTML není tak široce používán jako jiné webové formáty, jako je HTML nebo PDF, a kompatibilita se může u různých softwarů a platforem lišit.