Převeďte DOC do formátu JSON přes Java

On Premise Java API pro převod DOC na JSON bez použití Microsoft® Word nebo Microsoft® Excel

 

Převod DOC do formátu JSON prostřednictvím Aspose.Total for Java je jednoduchý dvoukrokový proces. Pomocí rozhraní API pro manipulaci s dokumenty a konverzi Aspose.Words for Java můžete exportovat DOC do HTML. Poté můžete pomocí Aspose.Cells for Java převést HTML na JSON.

Převeďte DOC do formátu JSON přes Java

  1. Otevřete soubor DOC pomocí třídy Document
  2. Převeďte DOC do HTML pomocí Save metoda
  3. Načtěte dokument HTML pomocí třídy Workbook
  4. Uložte dokument do formátu JSON pomocí Save metoda

Požadavky na převod

Aspose.Total pro Javu můžete snadno používat přímo z projektu založeného na Maven a zahrňte knihovny do vašeho pom.xml.

Případně můžete získat soubor ZIP z stažení .

Požadavky na převod

Pomocí rozhraní API můžete také otevřít dokument chráněný heslem. Pokud je váš vstupní dokument DOC chráněn heslem, nemůžete jej převést do formátu JSON bez použití hesla. Rozhraní API vám umožňuje otevřít zašifrovaný dokument předáním správného hesla v objektu LoadOptions. Následující příklad kódu ukazuje, jak se pokusit otevřít šifrovaný dokument pomocí hesla:

Převeďte chráněný DOC do formátu JSON přes Java

Zatímco převádíte DOC na JSON, můžete také nastavit rozsah výstupního formátu JSON. Chcete-li nastavit rozsah, můžete otevřít převedený HTML pomocí třídy Workbook, vytvořit rozsah dat k exportu pomocí metody Cells.createRange, zavolat metodu JsonUtility.exportRangeToJson s odkazy na Range & ExportRangeToJsonOptions a zapsat řetězec JSON dat do souboru přes Metoda BufferedWriter.write.

Prozkoumat možnosti konverzace DOC pomocí Java

Převést DOCs na CSV (Hodnoty oddělené čárkami)
Převést DOCs na DIF (Formát výměny dat)
Převést DOCs na EXCEL (Formáty tabulkových souborů)
Převést DOCs na FODS (OpenDocument Flat XML tabulka)
Převést DOCs na ODS (Tabulka OpenDocument)
Převést DOCs na SXC (Tabulka StarOffice Calc)
Převést DOCs na TSV (Hodnoty oddělené tabulátorem)
Převést DOCs na XLAM (Doplněk Excel s podporou maker)
Převést DOCs na XLS (Binární formát Microsoft Excel)
Převést DOCs na XLSB (Binární sešit Excel)
Převést DOCs na XLSM (Tabulka s podporou maker)
Převést DOCs na XLSX (Otevřete sešit XML)
Převést DOCs na XLT (Šablona Excel 97 - 2003)
Převést DOCs na XLTM (Šablona s podporou maker aplikace Excel)
Převést DOCs na XLTX (Excel šablona)
Převést DOCs na ODP (Formát prezentace OpenDocument)
Převést DOCs na POT (Soubory šablon aplikace Microsoft PowerPoint)
Převést DOCs na POTM (Soubor šablony Microsoft PowerPoint)
Převést DOCs na POTX (Prezentace šablony Microsoft PowerPoint)
Převést DOCs na PPTX (Formát otevřené prezentace XML)
Převést DOCs na PPS (Prezentace PowerPoint)
Převést DOCs na PPSM (Prezentace s podporou maker)
Převést DOCs na PPSX (Prezentace PowerPoint)
Převést DOCs na PPT (Prezentace v Powerpointu)
Převést DOCs na PPTM (Soubor prezentace s podporou maker)
Převést DOCs na PPTX (Formát otevřené prezentace XML)

Co je formát DOC

Microsoft Word Binary File Format (DOC) je proprietární formát souboru dokumentu používaný aplikací Microsoft Office Word. Představuje strukturu dokumentu, která je nezávislá na jakékoli konkrétní počítačové architektuře nebo operačním systému. Formát DOC slouží jako kontejnerový soubor využívající binární formát k ukládání různých typů dat, včetně formátovaného textu, obrázků, grafů a dalších. Binární povaha formátu DOC jej činí nečitelným pro člověka, ale existuje několik programů, jako je Microsoft Word a LibreOffice, které dokážou číst ze souborů DOC i zapisovat do nich.

Formát DOC byl původně představen ve Wordu pro Windows 2.0 již v roce 1987. Od té doby prošel několika revizemi, přičemž poslední iterací je formát Office Open XML představený v Office 2007. Jednou z klíčových výhod formátu DOC je jeho kompatibilita s Microsoft Word , jedna z celosvětově nejrozšířenějších aplikací pro zpracování textu. Tato kompatibilita umožňuje uživatelům vytvářet a upravovat dokumenty pomocí aplikace Microsoft Word a pohodlně je sdílet s ostatními, kteří tuto aplikaci také využívají. Kromě toho má mnoho dalších aplikací pro zpracování textu schopnost číst z formátu DOC a zapisovat do něj, což z něj činí všestrannou volbu pro účely sdílení dokumentů.

Široce rozšířené přijetí formátu DOC pramení z jeho integrace s Microsoft Word , poskytující uživatelům robustní a na funkce bohaté prostředí pro vytváření a správu dokumentů. Flexibilita formátu přesahuje Microsoft Word a umožňuje uživatelům pracovat se soubory DOC pomocí alternativního softwaru pro zpracování textu. Tato všestrannost zajišťuje bezproblémovou spolupráci na dokumentech a zaměnitelnost mezi uživateli, bez ohledu na jejich zvolenou aplikaci pro zpracování textu.

Co je formát JSON

Formát souboru JSON (JavaScript Object Notation) je lehký a široce používaný formát pro výměnu dat. Byl odvozen z programovacího jazyka JavaScript, ale nyní je jazykově nezávislý a je podporován různými programovacími jazyky. Soubory JSON ukládají data ve strukturovaném a čitelném formátu, takže je snadno pochopí a zpracují lidé i stroje.

Soubory JSON se skládají z párů klíč–hodnota uspořádaných do hierarchické struktury. Reprezentují data jednoduchým a intuitivním způsobem pomocí objektů (uzavřených ve složených závorkách {}) a polí (uzavřených v hranatých závorkách []). Každý klíč je spárován s odpovídající hodnotou, kterou může být řetězec, číslo, logická hodnota, null, objekt nebo pole. Tato flexibilita umožňuje JSON zpracovávat složité a vnořené datové struktury.

Jednou z hlavních výhod JSON je jeho jednoduchost a snadné použití. Jeho lehká povaha a minimální syntaxe jej činí efektivním pro přenos dat po sítích a ukládání do souborů. Soubory JSON se běžně používají pro výměnu dat mezi webovými servery a klienty a také pro konfigurační soubory, rozhraní API a ukládání strukturovaných dat.

Soubory JSON jsou čitelné pro lidi a lze je snadno pochopit a upravit pomocí textu editor. Jsou také strojově čitelné, což aplikacím umožňuje efektivně analyzovat a zpracovávat data JSON. Mnoho programovacích jazyků poskytuje vestavěné knihovny nebo balíčky pro práci s JSON, což zjednodušuje analýzu a serializaci dat JSON.