Pro vývojáře Pythonu, který se snaží přidat funkci převodu PDF na MHTML (formát webového archivu) nebo HtmlFixed, znamená chtít uložit dokument ve formátu HTML pomocí absolutně umístěných prvků v aplikaci. Aspose.Total for Python via .NET API může pomoci automatizovat proces převodu. Je to plný balík různých API zabývajících se různými formáty.
K přidání funkce převodu PDF na MHTML používáme API Aspose.Words for Python via .NET , které je součástí balíčku Aspose.Total for Python via .NET . V případě, že je soubor PDF jednoduchý, pak jsou to jen dva řádky kódu. Načtěte soubor PDF a zavolejte metodu uložení s příslušnou cestou k souboru spolu s výčtem SaveFormat jako MHTML nebo HTML_FIXED. Ale v případě, že je potřeba obnovit model dokumentu co nejblíže původnímu, je potřeba do výsledného dokumentu uložit nějaké extra informace, tzv. round-trip information.
Jak Převeďte PDF na MHTML v Pythonu
- Načtěte zdrojový soubor PDF pomocí třídy Document
- Vytvořte instanci HtmlSaveOptions
- Nastavte export_roundtrip_information jako True
- Zadejte SaveFormat jako MHTML
- Zavolejte metodu
save
, přičemž jako parametry zadejte cestu k výstupnímu souboru a SaveFormat. Váš soubor PDF je tedy převeden na MHTML na zadané cestě.
Požadavky na konverzi
- Pro převod formátu PDF na MHTML nebo HtmlFixed je vyžadován Python 3.5 nebo novější
- Referenční API v rámci projektu přímo z PyPI ( Aspose.Words )
- Nebo použijte následující příkazy pip
pip install aspose.words
- Kromě toho operační systém založený na Microsoft Windows nebo Linux (viz více Words ) a pro Linux zkontrolujte další požadavky pro gcc a libpython a postupujte podle pokynů INSTALL krok za krokem.