Att konvertera DOCX till TSV via Aspose.Total for Java är en enkel process i två steg. Genom att använda funktionsrika, dokumentmanipulerings- och konverterings-API Aspose.Words for Java , kan du exportera DOCX till HTML. Efter det, genom att använda Aspose.Cells for Java , kan du konvertera HTML till TSV.
Java API för att konvertera DOCX till TSV
Konverteringskrav
Du kan enkelt använda Aspose.Total för Java direkt från ett Maven baserat projekt och inkludera Aspose.Words for Java och Aspose.Cells for Java i din pom.xml.
Alternativt kan du få en ZIP-fil från downloads .
Gratis onlinekonverterare för DOCX till TSV
Konverteringskrav
Innan du konverterar DOCX till TSV kan du ta bort oanvänd information från DOCX Document via Aspose.Words for Java . Ibland kan du behöva ta bort oanvänd eller dubblerad information för att minska storleken på utdatadokumentet och bearbetningstiden. Klassen CleanupOptions låter dig ange alternativ för dokumentrensning. För att ta bort dubbletter av stilar eller bara oanvända stilar eller listor från dokumentet kan du använda metoden Cleanup . Du kan använda UnusedStyles och UnusedBuiltinStyles egenskaper för att upptäcka och ta bort stilar som är markerade som “oanvända”.
Ta bort oanvänd information från ett DOCX-dokument via Java
Efter att ha konverterat DOCX till TSV, gör Aspose.Cells for Java det möjligt för dig att spara ditt dokument för att streama. Om du behöver spara filer i en Stream ska du skapa ett FileOutputStream-objekt och sedan save filen till det Stream-objektet genom att anropa sparametoden för Workbook objekt.
Utforska DOCX konverteringsalternativ med Java
Vad är DOCX filformatet
DOCX är ett filformat för Word-dokument, utvecklat av Microsoft. Det är ett XML-baserat format som tillåter mer komplexa dokumentstrukturer än det äldre DOC-formatet och stöder funktioner som dokumentkryptering, digitala signaturer och vattenstämplar. DOCX-filer är också mindre i storlek än deras DOC-motsvarigheter, vilket gör dem mer effektiva att lagra och överföra.
Vad är TSV filformatet
En TSV-fil (tab-separated values) är ett enkelt textformat för att lagra data i en tabellstruktur, t.ex. en databas eller ett kalkylblad. Varje rad i tabellen lagras på en separat rad, och varje kolumn är separerad av ett tabbtecken. Varje rad är separerad av ett nyradstecken och varje kolumn avgränsas av ett tabbtecken. Detta gör det mycket enkelt att bearbeta TSV-filer med en textredigerare eller ett enkelt skript. Det finns inga formella standarder för TSV-filer, men formatet används i stor utsträckning och stöds av många applikationer.