Dla programisty Pythona, który próbuje dodać funkcję konwersji PDF do MHTML (format archiwum internetowego) lub HtmlFixed oznacza, że chce zapisać dokument w formacie HTML przy użyciu absolutnie pozycjonowanych elementów w aplikacji. API Aspose.Total for Python via .NET może pomóc zautomatyzować proces konwersji. Jest to pełny pakiet różnych interfejsów API obsługujących różne formaty.
Używamy API Aspose.Words for Python via .NET , które jest częścią pakietu Aspose.Total for Python via .NET , aby dodać funkcję konwersji PDF do MHTML. Jeśli plik PDF jest prosty, to tylko dwie linijki kodu. Załaduj plik PDF i wywołaj metodę save z odpowiednią ścieżką pliku wraz z wyliczeniem SaveFormat jako MHTML lub HTML_FIXED. Ale w przypadku, gdy istnieje potrzeba przywrócenia modelu dokumentu jak najbardziej zbliżonego do oryginalnego, konieczne jest zapisanie dodatkowych informacji w dokumencie wynikowym, zwanych informacjami w obie strony.
Jak Konwertuj PDF na MHTML w Pythonie
- Załaduj źródłowy plik PDF przy użyciu klasy ASSOSE.WORDS.DOCUMENT
- Utwórz wystąpienie HtmlSaveOptions
- Ustaw export_roundtrip_information jako True
- Określ SaveFormat jako MHTML
- Wywołaj metodę
save
, określając ścieżkę pliku wyjściowego i SaveFormat jako parametry. Więc twój plik PDF jest konwertowany na MHTML w określonej ścieżce.
Wymagania dotyczące konwersji
- Do konwersji formatu PDF na MHTML lub HtmlFixed wymagany jest Python 3.5 lub nowszy
- Referencyjne API w ramach projektu bezpośrednio z PyPI ( Aspose.Words )
- Lub użyj następujących poleceń pip
pip install aspose.words
- Co więcej, system operacyjny oparty na Microsoft Windows lub Linux (zobacz więcej na temat Words ) oraz Linux sprawdź dodatkowe wymagania dla gcc i libpython i postępuj zgodnie z instrukcjami krok po kroku INSTALL