Розділити HTML на частини в Python

Швидка Python бібліотека, щоб розділити один HTML файл на групу менших файлів відповідно до заданих критеріїв

Використовуйте Python via .NET бібліотеку, щоб розділити HTML файли на частини. Ви можете інтегрувати витягнуті сторінки HTML з іншими даними і, як наслідок, отримати документи потрібної форми та вмісту. Розбиття HTML на частини полегшує спільну роботу над HTML файлами.

Переглянути фрагмент коду

Розділіть HTML за допомогою Python

Ця бібліотека програмного забезпечення надає розробникам Python набір функцій для поділу HTML файлів на частини. Розділ HTML на окремі файли можна використовувати, щоб полегшити паралельну роботу з розділами документа. Наприклад, якщо кілька людей працюють над одним HTML одночасно, то розділення HTML дозволить їм прискорити роботу. Розщеплення HTML може бути частиною технології вилучення тексту з HTML файлів та інтеграції даних в автоматизовані інформаційні системи або бази даних.

Наша бібліотека надає розробникам Python усі необхідні функції для розбиття HTML на частини та вилучення сторінок відповідно до вказаного режиму. Це окреме рішення Python via .NET, яке не потребує встановлення Microsoft Word, Acrobat Reader чи інших програм.

Розділіть HTML файл на частини в Python коді

Розділіть вміст HTML за різними критеріями в Python. Ви можете використовувати такі режими вилучення сторінок для HTML файлів: 'розбити за заголовками', 'розділити за розділами', 'розділити сторінку за сторінкою', 'розділити за діапазонами сторінок'.

Після розділення вашого HTML файлу на частини ви можете експортувати результат у потрібний формат файлу за допомогою методу 'Document.Save'. Ви також можете керувати тим, як частини HTML експортуються в HTML або EPUB за допомогою властивості 'DocumentPartSavingCallback', що дозволить вам перенаправляти вихідні потоки.

Легко розділіть HTML документи за допомогою нашого рішення для Python via .NET. У наступному прикладі показано, як розділити HTML за допомогою Python:

Приклад Python коду для розділення HTML файлу
Завантажте файл, який потрібно розділити
Виконати код
Виберіть цільовий формат зі списку
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Виконати код

Як розділити HTML на частини Python

  1. Установіть Python бібліотеку, щоб програмно розділити HTML файли.
  2. Додайте посилання на бібліотеку (імпортуйте бібліотеку) до свого проекту Python.
  3. Відкрийте HTML у Python.
  4. Викличте метод extract_pages(), щоб витягти певні сторінки з HTML.
  5. Отримайте результат розділення HTML як окремі файли.

Python бібліотека, щоб розділити HTML документів

Ми розміщуємо наші пакунки Python у сховищах PyPi. Будь ласка, дотримуйтесь покрокових інструкцій щодо встановлення "Aspose.Words for Python via .NET" у середовище розробника.

Системні вимоги

Цей пакет сумісний з Python ≥3.5 і <3.12. Якщо ви розробляєте програмне забезпечення для Linux, перегляньте додаткові вимоги до gcc і libpython у документації продукту.

Інші підтримувані операції розділення HTML

Ви також можете розділити HTML на інші формати файлів:

5%

Підпишіться на оновлення продукту Aspose

Отримуйте щомісячні інформаційні бюлетені та пропозиції безпосередньо на вашу поштову скриньку.

© Aspose Pty Ltd 2001-2024. Всі права захищені.