Konwertuj MHT na TXT przez Python

Konwersja MHT na {{FILERESSULT}} Python. Programiści mogą użyć tego przykładowego kodu do eksportowania MHT do {{FILERESSULT}} w dowolnej platformie .NET Framework, .NET Core oraz PHP, VBScript, C++ poprzez COM Interop.

Konwertuj MHT na TXT w Python via .NET

Jak przekonwertować MHT na TXT? Możesz łatwo przekonwertować programowo dokument z formatu MHT na TXT za pomocą nowoczesnego interfejsu API Pythona do przetwarzania dokumentów. Użyj zaledwie kilku linijek kodu, aby przekonwertować pliki o wysokiej jakości. Biblioteka Aspose.PDF pozwoli każdemu deweloperowi łatwo rozwiązać zadania konwersji MHT na TXT za pomocą Pythona.

Aby uzyskać bardziej szczegółowy opis fragmentu kodu i innych możliwych formatów konwersji, zobacz strony Dokumentacji. Możesz również sprawdzić inne konwersje formatów, które są obsługiwane przez naszą bibliotekę.

Za pomocą biblioteki Aspose.PDF dla Pythona przez .NET możesz programowo przekonwertować MHT na TXT. Oprogramowanie PDF od Aspose jest idealne dla osób prywatnych, małych i dużych firm. Ponieważ jest w stanie przetworzyć dużą ilość informacji, wykonać konwersję szybko i wydajnie oraz chronić Twoje dane. Szczególną cechą Aspose.PDF jest API do konwersji MHT na TXT. Cechą tego podejścia jest to, że wystarczy otworzyć menedżera pakietów PyPI, wyszukać aspose-pdf i zainstalować go bez żadnych specjalnych złożonych ustawień. Aby sprawdzić zalety biblioteki, spróbuj użyć fragmentu kodu konwersji MHT na TXT. Możesz również użyć następującego polecenia z konsoli lub terminala:

Console

pip install aspose-pdf

Jak przekonwertować MHT na TXT


Python via .NET programiści mogą łatwo ładować i konwertować pliki MHT na TXT w zaledwie kilku wierszach kodu.

  1. Importuj wymagane moduły z biblioteki aspose.pdf, w tym FileIO, klasy ścieżek. Biblioteki te służą do interakcji z plikami PDF i zapisywania ich w innych formatach.
  2. Określ ścieżkę do wejściowego pliku PDF, łącząc indir z infile, zapewniając prawidłową strukturę katalogu.
  3. Utwórz instancję klasy MHTLoadOptions, aby określić format wyjściowy zapisu dokumentu. Te opcje kontrolują charakterystykę przekonwertowanego pliku MHT.
  4. Załaduj wejściowy plik PDF do obiektu Document za pomocą apdf.document (). Załadowany dokument będzie używany do przetwarzania i zapisywania w innych formatach.
  5. Wydrukuj liczbę stron w załadowanym dokumencie PDF. Informacje te są przydatne do weryfikacji dokładności załadowanego dokumentu.
  6. Utwórz instancję klasy TextDevice w celu przetworzenia dokumentu PDF w celu wyodrębnienia tekstu. Urządzenia te służą do wyodrębniania określonych danych z plików PDF, takich jak tekst lub obrazy.
  7. Użyj instancji TextDevice, aby przetworzyć pierwszą stronę załadowanego dokumentu PDF w celu wyodrębnienia tekstu. Wyodrębniony tekst zostanie zapisany w określonym pliku wyjściowym w path_outfile.
  8. Wydrukuj komunikat o powodzeniu wskazujący, że konwersja została zakończona po zapisaniu dokumentu w formacie TIFF. Ten krok potwierdza, że proces konwersji zakończył się sukcesem, a plik wyjściowy można znaleźć na określonej ścieżce.

Oto przykład, który pokazuje, jak przekonwertować MHT na TXT w Python. Możesz wykonać poniższe proste kroki, aby przekonwertować plik MHT na format TXT. Najpierw prześlij swój plik MHT, a następnie po prostu zapisz go jako plik TXT. Możesz używać w pełni kwalifikowanych nazw plików zarówno do odczytu MHT, jak i do zapisu TXT. Wynikowa zawartość i formatowanie TXT będą identyczne z oryginalnym dokumentem MHT.

Przykład: Konwertuj MHT na TXT przez Python

Ten przykładowy kod pokazuje MHT do TXT Python Konwersja

Input file:

File not added

Output format:

TXT

Output file:

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

load_options = apdf.MhtLoadOptions()
document = apdf.Document(path_infile, load_options)
print(len(document.pages))
device = apdf.devices.TextDevice()
device.process(document.pages[1], path_outfile)

print(infile + " converted into " + outfile)

Konwertuj MHT na TXT za pomocą biblioteki Python via .NET

Aspose.PDF dla Pythona poprzez API .NET obsługuje większość ustalonych standardów PDF i specyfikacji PDF. Umożliwia programistom wstawianie tabel, wykresów, obrazów, hiperłączy, niestandardowych czcionek - i nie tylko - do dokumentów PDF. Ponadto możliwe jest również kompresowanie dokumentów PDF. Aspose.PDF dla Pythona poprzez .NET zapewnia doskonałe funkcje bezpieczeństwa do tworzenia bezpiecznych dokumentów PDF. Niektóre z kluczowych funkcji Aspose.PDF dla Pythona za pośrednictwem interfejsu API .NET obejmują:

  • Możliwość odczytu i eksportu plików PDF w wielu formatach obrazu, w tym BMP, GIF, JPEG i PNG.
  • Ustaw podstawowe informacje (np. autor, twórca) dokumentu PDF.
  • Funkcje konwersji: Konwertuj PDF na Word, Excel i PowerPoint. Konwertuj PDF na formaty obrazów. Konwertuj plik PDF na format HTML i odwrotnie. Konwertuj PDF na EPUB, tekst, XPS itp.

Więcej informacji na temat Aspose.PDF dla Pythona można znaleźć za pośrednictwem interfejsu API .NET w naszej dokumentacji na temat korzystania z API.