Verwenden Sie die Python via .NET Bibliothek, um HTML Dateien in Teile aufzuteilen. Sie können die extrahierten HTML Seiten mit anderen Daten integrieren und erhalten als Ergebnis Dokumente in Form und Inhalt, die Sie benötigen. Das Aufteilen von HTML in Teile erleichtert die Zusammenarbeit an HTML Dateien.
Diese Softwarebibliothek stellt Python Entwicklern eine Reihe von Funktionen zur Verfügung, um HTML Dateien in Teile aufzuteilen. Das Aufteilen eines HTML in separate Dateien kann verwendet werden, um das parallele Arbeiten mit Abschnitten eines Dokuments zu erleichtern. Wenn beispielsweise mehrere Personen gleichzeitig an einem HTML arbeiten, können sie durch Aufteilen HTML die Arbeit beschleunigen. Das Aufteilen von HTML kann Teil einer Technologie zum Extrahieren von Text aus HTML Dateien und zum Integrieren von Daten in automatisierte Informationssysteme oder Datenbanken sein.
Unsere Bibliothek stellt Python Entwicklern alle notwendigen Funktionen zur Verfügung, um HTML in Teile aufzuteilen und Seiten gemäß dem angegebenen Modus zu extrahieren. Dies ist eine eigenständige Python via .NET Lösung, für die Microsoft Word, Acrobat Reader oder andere Anwendungen nicht installiert werden müssen.
HTML Inhalt unter Verwendung unterschiedlicher Kriterien im Python Code aufteilen. Sie können die folgenden Seitenextraktionsmodi für HTML Dateien verwenden: 'Aufteilen nach Überschriften', 'Aufteilen nach Abschnitten', 'Aufteilen Seite nach Seite', 'Aufteilen nach Seitenbereichen'.
Nachdem Sie Ihre HTML Datei in Teile aufgeteilt haben, können Sie das Ergebnis mit der Methode 'Document.Save' in das gewünschte Dateiformat exportieren. Sie können auch steuern, wie die HTML Teile in HTML oder EPUB exportiert werden, indem Sie die Eigenschaft 'DocumentPartSavingCallback' verwenden, mit der Sie Ausgabeströme umleiten können.
Teilen Sie HTML Dokumente einfach mit unserer Lösung für Python via .NET. Das folgende Beispiel zeigt, wie ein HTML mit Python:
pip install aspose-words
Kopieren
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
Wir hosten unsere Python Pakete in PyPi- Repositorys. Bitte befolgen Sie die Schritt-für-Schritt-Anleitung zur Installation von "Aspose.Words for Python via .NET" in Ihrer Entwicklerumgebung.
Dieses Paket ist mit Python ≥3.5 und <3.12 kompatibel. Wenn Sie Software für Linux entwickeln, schauen Sie sich bitte die zusätzlichen Anforderungen für gcc und libpython in der Produktdokumentation an.