Преобразование HTML в TXT через Python

Преобразование HTML в TXT в Python. Программисты могут использовать этот пример кода для экспорта HTML в TXT в любой платформе.NET Framework, .NET Core и PHP, VBScript, Delphi, C++ через COM Interop.

Преобразование HTML в TXT в Python for .NET

Как преобразовать HTML в TXT? Вы можете легко программно преобразовать документ из формата HTML в формат TXT с помощью современного API Python для обработки документов. Используйте всего несколько строк кода для высококачественного преобразования файлов. Библиотека Aspose.PDF позволит любому разработчику легко решить задачи преобразования HTML в TXT с помощью Python.

Более подробное описание фрагмента кода и других возможных форматов преобразования см. на страницах Документация. Кроме того, вы можете проверить другие конверсии форматов, которые поддерживаются нашей библиотекой.

С помощью библиотеки Aspose.PDF для .NET вы можете программно преобразовать HTML в TXT. Программное обеспечение PDF от Aspose идеально подходит для частных лиц, малого или крупного бизнеса. Поскольку он способен обрабатывать большой объем информации, выполняйте преобразование быстро и эффективно и защищайте ваши данные. Отличительной особенностью Aspose.PDF является API для преобразования HTML в TXT. Особенность этого подхода заключается в том, что вам нужно только открыть диспетчер пакетов NuGet, найти «Aspose.PDF для .NET» и установить его без особых сложных настроек. (Для установки используйте команду из консоли диспетчера пакетов). Чтобы убедиться в преимуществах библиотеки, попробуйте использовать фрагмент кода, преобразованный HTML в TXT. Можно также использовать следующую команду из консоли диспетчера пакетов:

Python Package Manager Console

pip install aspose-pdf

Как преобразовать HTML в TXT


Разработчики Python for .NET могут легко загружать и конвертировать файлы HTML в TXT всего за несколько строк кода.

  1. Загрузка HTML-файла с экземпляром документа
  2. Вызовите метод Document.Save, передав путь к выходному файлу и SaveFormat.Txt в качестве параметров
  3. Файл TXT будет сохранен по указанному пути

Вот пример, демонстрирующий, как преобразовать HTML в TXT в Python. Чтобы преобразовать файл HTML в формат TXT, выполните следующие простые шаги. Сначала загрузите файл HTML, а затем просто сохраните его как файл TXT. Можно использовать полные имена файлов как для чтения HTML, так и для записи TXT. Выходное содержимое и форматирование TXT будут идентичны исходному документу HTML.

Пример: Преобразование HTML в TXT с помощью Python

Этот пример кода показывает преобразование HTML в TXT на Python

Input file:

File not added

Output format:

TXT

Output file:

    def convert_HTML_to_TXT(self, infile, outfile):

        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        options = HtmlLoadOptions()

        # Open HTML document
        document = Document(path_infile, options)

        # create an object of TextDevice
        renderer = TextDevice()

        renderer.Process(document.Pages[1],path_outfile)

        print(infile + " converted into " + outfile)

Преобразуйте HTML в TXT с помощью библиотеки Python for .NET

Aspose.PDF для Python через API .NET поддерживает большинство установленных стандартов PDF и спецификаций PDF. Он позволяет разработчикам вставлять таблицы, графики, изображения, гиперссылки, собственные шрифты и многое другое в PDF-документы. Кроме того, можно сжимать PDF-документы. Aspose.PDF для Python через .NET предоставляет отличные функции безопасности для разработки защищенных PDF-документов. Некоторые из ключевых функций Aspose.PDF для Python через API .NET включают в себя:

  • Возможность чтения и экспорта PDF-файлов в различных форматах изображений, включая BMP, GIF, JPEG и PNG.
  • Задайте основную информацию (например, об авторе, создателе) PDF-документа.
  • Функции преобразования: конвертируйте PDF в Word, Excel и PowerPoint. Конвертируйте PDF в форматы изображений. Конвертируйте PDF-файл в формат HTML и наоборот. Конвертируйте PDF в формат EPUB, текст, XPS и т. д.

Дополнительную информацию о Aspose.PDF для Python через API .NET можно найти в нашей документации по использованию API.