Μετατροπή DOC σε μορφή JSON μέσω Java

Στο Premise Java API για μετατροπή DOC σε JSON χωρίς χρήση Microsoft® Word ή Microsoft® Excel

 

Η μετατροπή DOC σε μορφή JSON μέσω Aspose.Total for Java είναι μια απλή διαδικασία δύο βημάτων. Χρησιμοποιώντας το πλούσιο σε χαρακτηριστικά, το API χειρισμού εγγράφων και μετατροπής Aspose.Words για Java , μπορείτε να εξάγετε το DOC σε HTML. Μετά από αυτό, χρησιμοποιώντας το Aspose.Cells για Java , μπορείτε να μετατρέψετε HTML σε JSON.

Μετατροπή DOC σε μορφή JSON μέσω Java

  1. Ανοίξτε το αρχείο DOC χρησιμοποιώντας την κλάση Document
  2. Μετατρέψτε το DOC σε HTML χρησιμοποιώντας το Save μέθοδος
  3. Φορτώστε το έγγραφο HTML χρησιμοποιώντας την τάξη Workbook
  4. Αποθηκεύστε το έγγραφο σε μορφή JSON χρησιμοποιώντας το Save μέθοδο

Απαιτήσεις μετατροπής

Μπορείτε εύκολα να χρησιμοποιήσετε το Aspose.Total για Java απευθείας από ένα έργο που βασίζεται στο Maven και συμπεριλάβετε βιβλιοθήκες στο pom.xml σας.

Εναλλακτικά, μπορείτε να λάβετε ένα αρχείο ZIP από το downloads .

Απαιτήσεις μετατροπής

Χρησιμοποιώντας το API, μπορείτε επίσης να ανοίξετε το έγγραφο που προστατεύεται με κωδικό πρόσβασης. Εάν το έγγραφο DOC εισόδου σας προστατεύεται με κωδικό πρόσβασης, δεν μπορείτε να το μετατρέψετε σε μορφή JSON χωρίς να χρησιμοποιήσετε τον κωδικό πρόσβασης. Το API σάς επιτρέπει να ανοίξετε το κρυπτογραφημένο έγγραφο περνώντας τον σωστό κωδικό πρόσβασης σε ένα αντικείμενο LoadOptions. Το ακόλουθο παράδειγμα κώδικα δείχνει πώς να προσπαθήσετε να ανοίξετε ένα κρυπτογραφημένο έγγραφο με κωδικό πρόσβασης:

Μετατροπή προστατευμένου DOC σε μορφή JSON μέσω Java

Ενώ μετατρέπετε το DOC σε JSON, μπορείτε επίσης να ορίσετε το εύρος στη μορφή εξόδου JSON. Για να ορίσετε το εύρος, μπορείτε να ανοίξετε το μετατρεπόμενο HTML χρησιμοποιώντας την κλάση Βιβλίο εργασίας, να δημιουργήσετε ένα εύρος δεδομένων προς εξαγωγή χρησιμοποιώντας τη μέθοδο Cells.createRange, να καλέσετε τη μέθοδο JsonUtility.exportRangeToJson με αναφορές Range & ExportRangeToJsonOptions και να γράψετε δεδομένα JSON συμβολοσειράς στο αρχείο μέσω Μέθοδος BufferedWriter.write.

Εξερευνήστε DOC επιλογές μετατροπής με Java

Μετατροπή DOCs σε CSV (Τιμές διαχωρισμένες με κόμμα)
Μετατροπή DOCs σε DIF (Μορφή ανταλλαγής δεδομένων)
Μετατροπή DOCs σε EXCEL (Μορφές αρχείων υπολογιστικών φύλλων)
Μετατροπή DOCs σε FODS (Επίπεδο υπολογιστικό φύλλο OpenDocument XML)
Μετατροπή DOCs σε ODS (Υπολογιστικό φύλλο OpenDocument)
Μετατροπή DOCs σε SXC (Υπολογιστικό φύλλο StarOffice Calc)
Μετατροπή DOCs σε TSV (Τιμές διαχωρισμένες με καρτέλες)
Μετατροπή DOCs σε XLAM (Πρόσθετο με δυνατότητα Macro-Enabled)
Μετατροπή DOCs σε XLS (Δυαδική μορφή Microsoft Excel)
Μετατροπή DOCs σε XLSB (Δυαδικό βιβλίο εργασίας του Excel)
Μετατροπή DOCs σε XLSM (Υπολογιστικό φύλλο με δυνατότητα μακροεντολής)
Μετατροπή DOCs σε XLSX (Ανοίξτε το βιβλίο εργασίας XML)
Μετατροπή DOCs σε XLT (Πρότυπο Excel 97 - 2003)
Μετατροπή DOCs σε XLTM (Πρότυπο με δυνατότητα μακροεντολής Excel)
Μετατροπή DOCs σε XLTX (Πρότυπο Excel)
Μετατροπή DOCs σε ODP (Μορφή παρουσίασης OpenDocument)
Μετατροπή DOCs σε POT (Αρχεία προτύπων Microsoft PowerPoint)
Μετατροπή DOCs σε POTM (Αρχείο προτύπου Microsoft PowerPoint)
Μετατροπή DOCs σε POTX (Παρουσίαση προτύπου Microsoft PowerPoint)
Μετατροπή DOCs σε PPTX (Ανοίξτε τη μορφή παρουσίασης XML)
Μετατροπή DOCs σε PPS (Παρουσίαση PowerPoint)
Μετατροπή DOCs σε PPSM (Παρουσίαση με δυνατότητα μακροεντολής)
Μετατροπή DOCs σε PPSX (Παρουσίαση PowerPoint)
Μετατροπή DOCs σε PPT (Παρουσίαση powerpoint)
Μετατροπή DOCs σε PPTM (Αρχείο παρουσίασης με δυνατότητα μακροεντολής)
Μετατροπή DOCs σε PPTX (Ανοίξτε τη μορφή παρουσίασης XML)

Τι είναι μορφή αρχείου DOC

Το Microsoft Word Binary File Format (DOC) είναι μια ιδιόκτητη μορφή αρχείου εγγράφου που χρησιμοποιείται από το Microsoft Office Word. Αντιπροσωπεύει μια δομή εγγράφου που είναι ανεξάρτητη από οποιαδήποτε συγκεκριμένη αρχιτεκτονική υπολογιστή ή λειτουργικό σύστημα. Η μορφή DOC χρησιμεύει ως αρχείο κοντέινερ, χρησιμοποιώντας μια δυαδική μορφή για την αποθήκευση διαφόρων τύπων δεδομένων, συμπεριλαμβανομένων μορφοποιημένου κειμένου, εικόνων, γραφημάτων και άλλων. Η δυαδική φύση της μορφής DOC την καθιστά μη αναγνώσιμη από τον άνθρωπο, αλλά υπάρχουν αρκετά προγράμματα, όπως το Microsoft Word και το LibreOffice, που μπορούν να διαβάζουν και να γράφουν σε αρχεία DOC.

Η μορφή DOC ήταν αρχικά παρουσιάστηκε στο Word για Windows 2.0 το 1987. Έχει υποστεί αρκετές αναθεωρήσεις από τότε, με την πιο πρόσφατη επανάληψη να είναι η μορφή Office Open XML που εισήχθη στο Office 2007. Ένα από τα βασικά πλεονεκτήματα της μορφής DOC έγκειται στη συμβατότητά της με το Microsoft Word , μια από τις πιο ευρέως χρησιμοποιούμενες εφαρμογές επεξεργασίας κειμένου παγκοσμίως. Αυτή η συμβατότητα επιτρέπει στους χρήστες να δημιουργούν και να τροποποιούν έγγραφα χρησιμοποιώντας το Microsoft Word και να τα μοιράζονται εύκολα με άλλους που χρησιμοποιούν επίσης την εφαρμογή. Επιπλέον, πολλές άλλες εφαρμογές επεξεργασίας κειμένου διαθέτουν τη δυνατότητα ανάγνωσης και εγγραφής στη μορφή DOC, καθιστώντας την μια ευέλικτη επιλογή για σκοπούς κοινής χρήσης εγγράφων.

Η ευρεία υιοθέτηση της μορφής DOC πηγάζει από την ενσωμάτωσή της με το Microsoft Word , παρέχοντας στους χρήστες ένα ισχυρό και πλούσιο σε δυνατότητες περιβάλλον για τη δημιουργία και τη διαχείριση εγγράφων. Η ευελιξία της μορφής εκτείνεται πέρα από το Microsoft Word, επιτρέποντας στους χρήστες να εργάζονται με αρχεία DOC χρησιμοποιώντας εναλλακτικό λογισμικό επεξεργασίας κειμένου. Αυτή η ευελιξία εξασφαλίζει απρόσκοπτη συνεργασία εγγράφων και εναλλαξιμότητα μεταξύ των χρηστών, ανεξάρτητα από την επιλεγμένη εφαρμογή επεξεργασίας κειμένου.

Τι είναι μορφή αρχείου JSON

Η μορφή αρχείου JSON (JavaScript Object Notation) είναι μια ελαφριά και ευρέως χρησιμοποιούμενη μορφή ανταλλαγής δεδομένων. Προήλθε από τη γλώσσα προγραμματισμού JavaScript αλλά πλέον είναι ανεξάρτητο από τη γλώσσα και υποστηρίζεται από διάφορες γλώσσες προγραμματισμού. Τα αρχεία JSON αποθηκεύουν δεδομένα σε δομημένη και ευανάγνωστη μορφή, καθιστώντας τα εύκολα κατανοητά και επεξεργασμένα τόσο από ανθρώπους όσο και από μηχανήματα.

Τα αρχεία JSON αποτελούνται από ζεύγη κλειδιών-τιμών οργανωμένα σε ιεραρχική δομή. Αντιπροσωπεύουν δεδομένα με απλό και διαισθητικό τρόπο χρησιμοποιώντας αντικείμενα (περικλείονται σε σγουρές αγκύλες {}) και πίνακες (περικλείονται σε αγκύλες []). Κάθε κλειδί συνδυάζεται με μια αντίστοιχη τιμή, η οποία μπορεί να είναι συμβολοσειρά, αριθμός, boolean, null, αντικείμενο ή πίνακας. Αυτή η ευελιξία επιτρέπει στο JSON να χειρίζεται πολύπλοκες και ένθετες δομές δεδομένων.

Ένα από τα κύρια πλεονεκτήματα του JSON είναι η απλότητα και η ευκολία χρήσης του. Η ελαφριά φύση του και η ελάχιστη σύνταξη το καθιστούν αποτελεσματικό για τη μετάδοση δεδομένων μέσω δικτύων και την αποθήκευση σε αρχεία. Τα αρχεία JSON χρησιμοποιούνται συνήθως για ανταλλαγή δεδομένων μεταξύ διακομιστών ιστού και πελατών, καθώς και για αρχεία διαμόρφωσης, API και αποθήκευση δομημένων δεδομένων.

Τα αρχεία JSON είναι αναγνώσιμα από τον άνθρωπο και μπορούν εύκολα να γίνουν κατανοητά και να τροποποιηθούν χρησιμοποιώντας ένα κείμενο συντάκτης. Είναι επίσης αναγνώσιμα από μηχανή, επιτρέποντας στις εφαρμογές να αναλύουν και να επεξεργάζονται αποτελεσματικά τα δεδομένα JSON. Πολλές γλώσσες προγραμματισμού παρέχουν ενσωματωμένες βιβλιοθήκες ή πακέτα για εργασία με JSON, απλοποιώντας την ανάλυση και τη σειριοποίηση δεδομένων JSON.