Χωρίστε το HTML σε μέρη στο Java

Γρήγορη βιβλιοθήκη Java για να χωρίσετε ένα HTML αρχείο σε μια ομάδα μικρότερων αρχείων σύμφωνα με τα δεδομένα κριτήρια

Χρησιμοποιήστε τη βιβλιοθήκη Java για να χωρίσετε HTML αρχεία σε μέρη. Μπορείτε να ενσωματώσετε τις εξαγόμενες σελίδες HTML με άλλα δεδομένα και, ως αποτέλεσμα, να λάβετε έγγραφα της μορφής και του περιεχομένου που χρειάζεστε. Ο διαχωρισμός του HTML σε μέρη διευκολύνει τη συνεργασία σε HTML αρχεία.

Προβολή αποσπάσματος κώδικα

Διαχωρίστε το HTML χρησιμοποιώντας Java

Αυτή η βιβλιοθήκη λογισμικού παρέχει στους προγραμματιστές Java ένα σύνολο λειτουργιών για να χωρίσουν τα HTML αρχεία σε μέρη. Ο διαχωρισμός ενός HTML σε ξεχωριστά αρχεία μπορεί να χρησιμοποιηθεί για να διευκολύνει την παράλληλη εργασία με τμήματα ενός εγγράφου. Για παράδειγμα, εάν πολλά άτομα εργάζονται σε ένα HTML ταυτόχρονα, τότε ο διαχωρισμός HTML θα τους επιτρέψει να επιταχύνουν την εργασία. Ο διαχωρισμός HTML μπορεί να είναι μέρος μιας τεχνολογίας εξαγωγής κειμένου από HTML αρχεία και ενσωμάτωσης δεδομένων σε αυτοματοποιημένα συστήματα πληροφοριών ή βάσεις δεδομένων.

Η βιβλιοθήκη μας παρέχει στους προγραμματιστές Java όλες τις απαραίτητες λειτουργίες για να χωρίσουν το HTML σε μέρη και να εξαγάγουν σελίδες σύμφωνα με την καθορισμένη λειτουργία. Αυτή είναι μια αυτόνομη λύση Java που δεν χρειάζεται εγκατεστημένο το Microsoft Word, το Acrobat Reader ή άλλες εφαρμογές.

Διαχωρίστε ένα HTML αρχείο σε μέρη στον κώδικα Java

Διαχωρίστε το περιεχόμενο HTML χρησιμοποιώντας διαφορετικά κριτήρια στον κώδικα Java. Μπορείτε να χρησιμοποιήσετε τις ακόλουθες λειτουργίες εξαγωγής σελίδων για HTML αρχεία: 'διαίρεση κατά επικεφαλίδες', 'διαίρεση κατά τμήματα', 'διαχωρισμός σελίδας προς σελίδα', 'διαχωρισμός κατά εύρος σελίδων'.

Αφού χωρίσετε το αρχείο σας HTML σε μέρη, μπορείτε να εξαγάγετε το αποτέλεσμα στην απαιτούμενη μορφή αρχείου χρησιμοποιώντας τη μέθοδο 'Document.Save'. Μπορείτε επίσης να ελέγξετε τον τρόπο εξαγωγής των τμημάτων HTML σε HTML ή EPUB χρησιμοποιώντας την ιδιότητα 'DocumentPartSavingCallback', η οποία θα σας επιτρέψει να ανακατευθύνετε τις ροές εξόδου.

Διαχωρίστε εύκολα HTML έγγραφα με τη λύση μας για το Java. Το παρακάτω παράδειγμα δείχνει πώς να χωρίσετε ένα HTML χρησιμοποιώντας Java:

Παράδειγμα κώδικα Java για να χωρίσετε ένα HTML αρχείο
Ανεβάστε ένα αρχείο που θέλετε να χωρίσετε
Εκτέλεση κώδικα
Επιλέξτε τη μορφή προορισμού από τη λίστα
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>ver</version>
  <classifier>jdk17</classifier>
</dependency>
αντίγραφο
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
αντίγραφο
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
 <artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
αντίγραφο
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
αντίγραφο
import com.aspose.words.*;

Document doc = new Document("Input.html");

for (int page = 0; page < doc.getPageCount(); page++)
{
    Document extractedPage = doc.extractPages(page, 1);
    extractedPage.save(String.format("Output_%d.html", page + 1));
}
Εκτέλεση κώδικα

Πώς να χωρίσετε το HTML σε Java

  1. Εγκαταστήστε τη βιβλιοθήκη Java για να χωρίσετε HTML αρχεία μέσω προγραμματισμού.
  2. Προσθέστε μια αναφορά βιβλιοθήκης (εισαγωγή της βιβλιοθήκης) στο έργο σας Java.
  3. Ανοίξτε το HTML στο Java.
  4. Καλέστε τη μέθοδο extractPages() για να εξαγάγετε συγκεκριμένες σελίδες από το HTML.
  5. Λάβετε το αποτέλεσμα του διαχωρισμού του HTML ως ξεχωριστά αρχεία.

Java βιβλιοθήκη για διαχωρισμό HTML εγγράφων

Φιλοξενούμε τα πακέτα Java μας στα αποθετήρια Maven. 'Aspose.Words για Java' είναι ένα κοινό JAR που περιέχει byte-κώδικα. Ακολουθήστε τις οδηγίες βήμα προς βήμα σχετικά με τον τρόπο εγκατάστασης στο περιβάλλον προγραμματιστή Java.

Απαιτήσεις συστήματος

Υποστηρίζονται Java SE 7 και πιο πρόσφατες Java Παρέχουμε επίσης ένα ξεχωριστό πακέτο για το Java SE 6 σε περίπτωση που είστε υποχρεωμένοι να χρησιμοποιήσετε αυτό το ξεπερασμένο JRE.

Το Java μας είναι πολλαπλών πλατφορμών και τρέχει σε όλα τα λειτουργικά συστήματα με JVM, συμπεριλαμβανομένων των Microsoft Windows, Linux, macOS, Android και iOS.

Για πληροφορίες σχετικά με τις προαιρετικές εξαρτήσεις πακέτων, όπως JogAmp JOGL, Harfbuzz γραμματοσειράς Java Advanced Imaging JAI, ανατρέξτε στην Τεκμηρίωση προϊόντος.

Άλλες υποστηριζόμενες λειτουργίες διαχωρισμού HTML

Μπορείτε επίσης να χωρίσετε το HTML σε άλλες μορφές αρχείων:

5%

Εγγραφείτε στις ενημερώσεις προϊόντων Aspose

Λάβετε μηνιαία ενημερωτικά δελτία και προσφορές απευθείας στο γραμματοκιβώτιό σας.

© Aspose Pty Ltd 2001-2024. Ολα τα δικαιώματα διατηρούνται.