Konwertuj DOC na MHTML za pomocą Pythona

Konwersja DOC do MHTML, HtmlFixed i HTML w aplikacjach Pythona bez instalowania Microsoft Word®.

 

Dla programisty Pythona, który próbuje dodać funkcję konwersji DOC do MHTML (format archiwum internetowego) lub HtmlFixed oznacza, że chce zapisać dokument w formacie HTML przy użyciu absolutnie pozycjonowanych elementów w aplikacji. API Aspose.Total for Python via .NET może pomóc zautomatyzować proces konwersji. Jest to pełny pakiet różnych interfejsów API obsługujących różne formaty.

Używamy API Aspose.Words for Python via .NET , które jest częścią pakietu Aspose.Total for Python via .NET , aby dodać funkcję konwersji DOC do MHTML. Jeśli plik DOC jest prosty, to tylko dwie linijki kodu. Załaduj plik DOC i wywołaj metodę save z odpowiednią ścieżką pliku wraz z wyliczeniem SaveFormat jako MHTML lub HTML_FIXED. Ale w przypadku, gdy istnieje potrzeba przywrócenia modelu dokumentu jak najbardziej zbliżonego do oryginalnego, konieczne jest zapisanie dodatkowych informacji w dokumencie wynikowym, zwanych informacjami w obie strony.

Jak Konwertuj DOC na MHTML w Pythonie

  • Załaduj źródłowy plik DOC przy użyciu klasy ASSOSE.WORDS.DOCUMENT
  • Utwórz wystąpienie HtmlSaveOptions
  • Ustaw export_roundtrip_information jako True
  • Określ SaveFormat jako MHTML
  • Wywołaj metodę save, określając ścieżkę pliku wyjściowego i SaveFormat jako parametry. Więc twój plik DOC jest konwertowany na MHTML w określonej ścieżce.

Wymagania dotyczące konwersji

  • Do konwersji formatu DOC na MHTML lub HtmlFixed wymagany jest Python 3.5 lub nowszy
  • Referencyjne API w ramach projektu bezpośrednio z PyPI ( Aspose.Words )
  • Lub użyj następujących poleceń pip pip install aspose.words
  • Co więcej, system operacyjny oparty na Microsoft Windows lub Linux (zobacz więcej na temat Words ) oraz Linux sprawdź dodatkowe wymagania dla gcc i libpython i postępuj zgodnie z instrukcjami krok po kroku INSTALL
 

Zapisz DOC do MHTML w Pythonie - Simple

 
 

Konwersja DOC do MHTML w Pythonie

 

Eksploruj DOC opcji konwersji z Python

Przelicz DOCs na CSV (Wartości oddzielone przecinkami)
Przelicz DOCs na DIF (Format wymiany danych)
Przelicz DOCs na EMAIL (Pliki e-mail)
Przelicz DOCs na EML (Wiadomość e-mail)
Przelicz DOCs na EMLX (Wiadomość Apple Mail)
Przelicz DOCs na EXCEL (Formaty plików arkuszy kalkulacyjnych)
Przelicz DOCs na FODS (Płaski arkusz kalkulacyjny XML OpenDocument)
Przelicz DOCs na ICS (Plik kalendarza)
Przelicz DOCs na MBOX (Plik skrzynki pocztowej e-mail)
Przelicz DOCs na MSG (Plik elementu wiadomości programu Outlook)
Przelicz DOCs na ODP (Format prezentacji OpenDocument)
Przelicz DOCs na ODS (Arkusz kalkulacyjny OpenDocument)
Przelicz DOCs na OFT (Szablon pliku programu Outlook)
Przelicz DOCs na OST (Tabela przechowywania w trybie offline programu Outlook)
Przelicz DOCs na POT (Pliki szablonów programu Microsoft PowerPoint)
Przelicz DOCs na POTM (Plik szablonu Microsoft PowerPoint)
Przelicz DOCs na POTX (Prezentacja szablonu Microsoft PowerPoint)
Przelicz DOCs na POWERPOINT (Pliki prezentacji)
Przelicz DOCs na PPS (Pokaz slajdów PowerPointa)
Przelicz DOCs na PPSM (Pokaz slajdów z obsługą makr)
Przelicz DOCs na PPSX (Pokaz slajdów PowerPointa)
Przelicz DOCs na PPT (Prezentacja Powerpoint)
Przelicz DOCs na PPTM (Plik prezentacji z obsługą makr)
Przelicz DOCs na PPTX (Otwarty format prezentacji XML)
Przelicz DOCs na PST (Tabela przechowywania osobistego programu Outlook)
Przelicz DOCs na SXC (Arkusz kalkulacyjny StarOffice Calc)
Przelicz DOCs na TSV (Wartości oddzielone tabulatorami)
Przelicz DOCs na XLAM (Dodatek programu Excel z obsługą makr)
Przelicz DOCs na XLS (Format binarny programu Microsoft Excel)
Przelicz DOCs na XLSB (Binarny skoroszyt programu Excel)
Przelicz DOCs na XLSM (Arkusz kalkulacyjny z obsługą makr)
Przelicz DOCs na XLSX (Otwórz skoroszyt XML)
Przelicz DOCs na XLT (Szablon programu Excel 97 - 2003)
Przelicz DOCs na XLTM (Szablon programu Excel z obsługą makr)
Przelicz DOCs na XLTX (Szablon Excela)

Co to jest DOC Format pliku

Microsoft Word Binary File Format (DOC) to zastrzeżony format pliku dokumentu używany przez Microsoft Office Word. Reprezentuje strukturę dokumentu, która jest niezależna od konkretnej architektury komputera lub systemu operacyjnego. Format DOC służy jako plik kontenera, wykorzystując format binarny do przechowywania różnych typów danych, w tym sformatowanego tekstu, obrazów, wykresów i innych. Binarny charakter formatu DOC czyni go nieczytelnym dla człowieka, ale istnieje kilka programów, takich jak Microsoft Word i LibreOffice, które mogą zarówno odczytywać, jak i zapisywać pliki DOC.

Format DOC był pierwotnie wprowadzony w programie Word dla Windows 2.0 w 1987 r. Od tego czasu przeszedł kilka poprawek, a najnowszą iteracją był format Office Open XML wprowadzony w pakiecie Office 2007. Jedną z kluczowych zalet formatu DOC jest jego zgodność z programem Microsoft Word , jeden z najczęściej używanych edytorów tekstu na świecie. Ta kompatybilność umożliwia użytkownikom tworzenie i modyfikowanie dokumentów za pomocą programu Microsoft Word oraz wygodne udostępnianie ich innym osobom, które również korzystają z aplikacji. Co więcej, wiele innych aplikacji do przetwarzania tekstu ma możliwość odczytu i zapisu w formacie DOC, co czyni go wszechstronnym wyborem do udostępniania dokumentów.

Powszechne przyjęcie formatu DOC wynika z jego integracji z programem Microsoft Word , zapewniając użytkownikom solidne i bogate w funkcje środowisko do tworzenia dokumentów i zarządzania nimi. Elastyczność formatu wykracza poza Microsoft Word, umożliwiając użytkownikom pracę z plikami DOC przy użyciu alternatywnego oprogramowania do edycji tekstu. Ta wszechstronność zapewnia bezproblemową współpracę nad dokumentami i wymienność między użytkownikami, niezależnie od wybranego przez nich edytora tekstu.

Co to jest MHTML Format pliku

MHTML, skrót od MIME HTML, to format pliku, który łączy kod HTML i powiązane z nim zasoby w jeden plik. To skrót od Multipurpose Internet Mail Extension HTML. Pliki MHTML są powszechnie używane do zapisywania stron internetowych, w tym całej ich zawartości, takiej jak obrazy, arkusze stylów CSS i JavaScript, w jednym pliku.

Pliki MHTML są często tworzone przez przeglądarki internetowe, gdy użytkownicy zapisują strony internetowe do trybu offline przeglądania lub archiwizacji. Łącząc wszystkie niezbędne zasoby w jednym pliku, MHTML zapewnia dokładne przeglądanie i renderowanie strony internetowej, nawet bez połączenia internetowego lub dostępu do oryginalnego serwera.

Format MHTML jest zgodny ze standardem MIME, który służy do kodowania i wymiany różnego rodzaju danych przez Internet. Wykorzystuje wieloczęściowe kodowanie MIME do spakowania kodu HTML i powiązanych zasobów w jednym pliku. Plik ma zwykle rozszerzenie .mht lub .mhtml.

Pliki MHTML można otwierać i wyświetlać w przeglądarkach internetowych obsługujących ten format, takich jak Internet Explorer, Microsoft Edge i Opera. Niektóre edytory tekstu i specjalistyczne oprogramowanie zapewniają również możliwość otwierania i edytowania plików MHTML.

Format MHTML oferuje korzyści pod względem przenośności i wygody, ponieważ umożliwia użytkownikom zapisywanie i udostępnianie stron internetowych jako jednego pliku, zapewnienie zachowania układu strony, formatowania i powiązanych zasobów. Warto jednak zauważyć, że MHTML nie jest tak szeroko stosowany jak inne formaty internetowe, takie jak HTML czy PDF, a kompatybilność może się różnić w zależności od oprogramowania i platform.