Konwertuj HTML na TXT przez Python

Konwersja HTML na {{FILERESSULT}} Python. Programiści mogą użyć tego przykładowego kodu do eksportowania HTML do {{FILERESSULT}} w dowolnej platformie .NET Framework, .NET Core oraz PHP, VBScript, C++ poprzez COM Interop.

Konwertuj HTML na TXT w Python via .NET

Jak przekonwertować HTML na TXT? Możesz łatwo przekonwertować programowo dokument z formatu HTML na TXT za pomocą nowoczesnego interfejsu API Pythona do przetwarzania dokumentów. Użyj zaledwie kilku linijek kodu, aby przekonwertować pliki o wysokiej jakości. Biblioteka Aspose.PDF pozwoli każdemu deweloperowi łatwo rozwiązać zadania konwersji HTML na TXT za pomocą Pythona.

Aby uzyskać bardziej szczegółowy opis fragmentu kodu i innych możliwych formatów konwersji, zobacz strony Dokumentacji. Możesz również sprawdzić inne konwersje formatów, które są obsługiwane przez naszą bibliotekę.

Za pomocą biblioteki Aspose.PDF dla Pythona przez .NET możesz programowo przekonwertować HTML na TXT. Oprogramowanie PDF od Aspose jest idealne dla osób prywatnych, małych i dużych firm. Ponieważ jest w stanie przetworzyć dużą ilość informacji, wykonać konwersję szybko i wydajnie oraz chronić Twoje dane. Szczególną cechą Aspose.PDF jest API do konwersji HTML na TXT. Cechą tego podejścia jest to, że wystarczy otworzyć menedżera pakietów PyPI, wyszukać aspose-pdf i zainstalować go bez żadnych specjalnych złożonych ustawień. Aby sprawdzić zalety biblioteki, spróbuj użyć fragmentu kodu konwersji HTML na TXT. Możesz również użyć następującego polecenia z konsoli lub terminala:

Console

pip install aspose-pdf

Jak przekonwertować HTML na TXT


Python via .NET programiści mogą łatwo ładować i konwertować pliki HTML na TXT w zaledwie kilku wierszach kodu.

  1. Określ ścieżkę do wejściowego pliku PDF, łącząc indir z infile, zapewniając prawidłową strukturę katalogu.
  2. Utwórz instancję HTMLLoadOptions z biblioteki aspose.pdf, aby określić ustawienia ładowania i przetwarzania wejściowego pliku PDF, ale nie ustawiaj żadnych konkretnych opcji.
  3. Użyj klasy Dokument z biblioteki aspose.pdf, aby utworzyć nowy obiekt, który będzie używany do generowania i zapisywania plików wyjściowych, przechodząc ścieżkę do pliku wejściowego i opcje ładowania.
  4. Określ indeks strony do przetworzenia, uzyskując dostęp do atrybutu pages obiektu dokumentu, zwykle używając liczby zaczynającej się od 0.
  5. Utwórz instancję TextDevice z biblioteki aspose.pdf, która służy do przetwarzania i generowania formatów wyjściowych opartych na tekście, takich jak PDF/A-1a.
  6. Użyj metody procesu instancji urządzenia tekstowego, aby zastosować określoną stronę lub strony do pliku wyjściowego na zdefiniowanej ścieżce.
  7. Przetwarzaj pojedynczą stronę oryginalnego dokumentu za pomocą urządzenia TextDevice, co daje reprezentację tekstową, którą można zapisać jako plik zakodowany przez ASCII.

Oto przykład, który pokazuje, jak przekonwertować HTML na TXT w Python. Możesz wykonać poniższe proste kroki, aby przekonwertować plik HTML na format TXT. Najpierw prześlij swój plik HTML, a następnie po prostu zapisz go jako plik TXT. Możesz używać w pełni kwalifikowanych nazw plików zarówno do odczytu HTML, jak i do zapisu TXT. Wynikowa zawartość i formatowanie TXT będą identyczne z oryginalnym dokumentem HTML.

Przykład: Konwertuj HTML na TXT przez Python

Ten przykładowy kod pokazuje HTML do TXT Python Konwersja

Input file:

File not added

Output format:

TXT

Output file:

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

load_options = apdf.HtmlLoadOptions()
document = apdf.Document(path_infile, load_options)

device = apdf.devices.TextDevice()
device.process(document.pages[1], path_outfile)

print(infile + " converted into " + outfile)

Konwertuj HTML na TXT za pomocą biblioteki Python via .NET

Aspose.PDF dla Pythona poprzez API .NET obsługuje większość ustalonych standardów PDF i specyfikacji PDF. Umożliwia programistom wstawianie tabel, wykresów, obrazów, hiperłączy, niestandardowych czcionek - i nie tylko - do dokumentów PDF. Ponadto możliwe jest również kompresowanie dokumentów PDF. Aspose.PDF dla Pythona poprzez .NET zapewnia doskonałe funkcje bezpieczeństwa do tworzenia bezpiecznych dokumentów PDF. Niektóre z kluczowych funkcji Aspose.PDF dla Pythona za pośrednictwem interfejsu API .NET obejmują:

  • Możliwość odczytu i eksportu plików PDF w wielu formatach obrazu, w tym BMP, GIF, JPEG i PNG.
  • Ustaw podstawowe informacje (np. autor, twórca) dokumentu PDF.
  • Funkcje konwersji: Konwertuj PDF na Word, Excel i PowerPoint. Konwertuj PDF na formaty obrazów. Konwertuj plik PDF na format HTML i odwrotnie. Konwertuj PDF na EPUB, tekst, XPS itp.

Więcej informacji na temat Aspose.PDF dla Pythona można znaleźć za pośrednictwem interfejsu API .NET w naszej dokumentacji na temat korzystania z API.