A DOCX konvertálása TSV-vé az Aspose.Total for Java egy egyszerű kétlépéses folyamat. A funkciókban gazdag, dokumentumkezelési és -konverziós API Aspose.Words for Java használatával DOCX-t HTML-be exportálhat. Ezt követően az Aspose.Cells for Java használatával konvertálhatja a HTML-t TSV-vé.
Java API a DOCX konvertálásához TSV-vé
- Nyissa meg a DOCX-fájlt a Document osztály használatával
- A [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) segítségével konvertálja a DOCX-t HTML-vé. ) módszerrel
- Töltsön be HTML-dokumentumot a Workbook osztály használatával
- Mentse a dokumentumot TSV formátumba a Save segítségével. SaveOptions)) módszer
Konverziós követelmények
Az Aspose.Total for Java könnyen használható közvetlenül Maven alapú projektből és tartalmazza az Aspose.Words for Java és az Aspose.Cells for Java a pom.xml-ben.
Alternatív megoldásként beszerezhet egy ZIP-fájlt a downloads .
Ingyenes online konverter DOCX-hez TSV-be
Konverziós követelmények
Mielőtt a DOCX-t TSV-vé alakítaná, eltávolíthatja a fel nem használt információkat a DOCX-dokumentumból az Aspose.Words for Java segítségével. Néha előfordulhat, hogy el kell távolítania a fel nem használt vagy ismétlődő információkat a kimeneti dokumentum méretének és a feldolgozási idő csökkentése érdekében. A CleanupOptions osztály lehetővé teszi a dokumentumok tisztítására vonatkozó beállítások megadását. Az ismétlődő stílusok vagy csak a nem használt stílusok vagy listák dokumentumból való eltávolításához használja a Cleanup metódust. Használhatja a UnusedStyles és az UnusedBuiltinStyles /com.aspose.words/cleanupoptions#UnusedBuiltinStyles) tulajdonságok a „nem használtként” megjelölt stílusok észleléséhez és eltávolításához.
Távolítsa el a fel nem használt információkat a DOCX-dokumentumból Java segítségével
A DOCX TSV-vé konvertálása után az Aspose.Cells for Java lehetővé teszi a dokumentum adatfolyamba való mentését. Ha a fájlokat adatfolyamba kell menteni, akkor hozzon létre egy FileOutputStream objektumot, majd save a fájlt a Stream objektumhoz a Workbook mentési metódusának meghívásával. tárgy.
DOCX konverziós beállítások felfedezése Java
Mi a DOCX fájlformátum
A DOCX a Microsoft által kifejlesztett Word dokumentumok fájlformátuma. Ez egy XML-alapú formátum, amely bonyolultabb dokumentumszerkezeteket tesz lehetővé, mint a régebbi DOC formátum, és támogatja az olyan funkciókat, mint a dokumentumtitkosítás, a digitális aláírás és a vízjel. A DOCX fájlok mérete is kisebb, mint a DOC megfelelőik, így hatékonyabban tárolhatók és továbbíthatók.
Mi a TSV fájlformátum
A tabulátorral elválasztott értékek (TSV) fájl egy egyszerű szövegformátum az adatok táblázatos struktúrában, például adatbázisban vagy táblázatban történő tárolására. A táblázat minden sora külön sorban van tárolva, és minden oszlopot tabulátor karakter választ el. Minden sort egy újsor karakter választ el, az oszlopokat pedig egy tabulátor karakter választja el. Ez nagyon megkönnyíti a TSV-fájlok feldolgozását szövegszerkesztővel vagy egyszerű szkripttel. A TSV-fájlokra nincsenek formális szabványok, de a formátumot széles körben használják és számos alkalmazás jól támogatja.