Конвертировать DOC в CSV через Java или онлайн-приложение

Локальный Java API для преобразования DOC в CSV без использования Microsoft® Word или Microsoft® Excel

 

Преобразование DOC в CSV с помощью Aspose.Total для Java — это простой двухэтапный процесс. Используя многофункциональный API для обработки и преобразования документов Aspose.Words for Java , вы можете экспортировать DOC в HTML. После этого, используя Aspose.Cells for Java , вы можете конвертировать HTML в CSV.

Java API для преобразования DOC в CSV

  1. Откройте файл DOC, используя класс Document .
  2. Преобразуйте DOC в HTML, используя Save метод
  3. Загрузите HTML-документ с помощью класса Workbook .
  4. Сохраните документ в формате CSV с помощью save метод

Требования к конвертации

Вы можете легко использовать Aspose.Total для Java непосредственно из проекта на основе Maven . и включите Aspose.Words для Java и Aspose.Cells для Java в вашем pom.xml.

Кроме того, вы можете получить ZIP-файл из загрузки .

// supports DOC, DOT, DOCX, DOCM, DOTX, DOTM, RTF, WordML, MOBI, ODT, and OTT input file formats
// load DOCX with an instance of Document
Document document = new Document("template.docx");
// call Save method while passing SaveFormat.HTML
document.save("html_output.html",SaveFormat.HTML);
// load the HTML file in an instance of Workbook
Workbook book = new Workbook("html_output.html");
// supports XLS, XLSX, XLSB, XLSM, XLT, XLT, XLTM, XLAM, CSV, TSV, ODS, DIF, SXC, and FODS file formats
// save HTML as XLSX
book.save("output.xlsx", SaveFormat.AUTO);

Бесплатный онлайн-конвертер DOC в CSV

Требования к конвертации

Перед преобразованием DOC в CSV вы можете удалить неиспользуемую информацию из документа DOC через Aspose.Words for Java . Иногда может потребоваться удалить неиспользуемую или повторяющуюся информацию, чтобы уменьшить размер выходного документа и время обработки. Класс CleanupOptions позволяет указать параметры очистки документа. Чтобы удалить повторяющиеся стили или просто неиспользуемые стили или списки из документа, вы можете использовать метод Очистка . Вы можете использовать UnusedStyles и UnusedBuiltinStyles для обнаружения и удаления стилей, помеченных как «неиспользуемые».

// supports DOC, DOT, DOCX, DOCM, DOTX, DOTM, RTF, WordML, MOBI, ODT, and OTT input file formats
// load DOCX with an instance of Document
Document doc = new Document("template.docx");
// set cleanup optoions
CleanupOptions cleanupoptions = new CleanupOptions();
// set unused lists
cleanupoptions.setUnusedLists(false);
// set unused styles
cleanupoptions.setUnusedStyles(true);
// cleans unused styles and lists from the document depending on given
doc.cleanup(cleanupoptions);
// save document
doc.save("Document.Cleanup_out.docx");

Удалить неиспользуемую информацию из документа DOC через Java

После преобразования DOC в CSV Aspose.Cells for Java позволяет сохранить документ для потоковой передачи. Если вам нужно сохранить файлы в поток, вам следует создать объект FileOutputStream, а затем save файл в этот объект Stream, вызвав метод сохранения Workbook объект.

// supports XLS, XLSX, XLSB, XLSM, XLT, XLT, XLTM, XLAM, CSV, TSV, ODS, DIF, SXC, and FODS file formats
// open document
Workbook workbook = new Workbook("Book1.xlsx");
// create FileOutputStream object
FileOutputStream stream = new FileOutputStream("SFToStream_out.xlsx");
// save document
workbook.save(stream, SaveFormat.AUTO);
// close stream
stream.close();

Исследуйте варианты преобразования DOC с Java

Конвертировать DOCs в DIF (Формат обмена данными)
Конвертировать DOCs в EXCEL (Форматы файлов электронных таблиц)
Конвертировать DOCs в FODS (Плоская XML-таблица OpenDocument)
Конвертировать DOCs в ODS (Электронная таблица OpenDocument)
Конвертировать DOCs в SXC (Электронная таблица StarOffice Calc)
Конвертировать DOCs в TSV (Значения, разделенные табуляцией)
Конвертировать DOCs в XLAM (Надстройка Excel с поддержкой макросов)
Конвертировать DOCs в XLS (Двоичный формат Microsoft Excel)
Конвертировать DOCs в XLSB (Двоичная книга Excel)
Конвертировать DOCs в XLSM (Электронная таблица с поддержкой макросов)
Конвертировать DOCs в XLSX (Открытая XML-книга)
Конвертировать DOCs в XLT (Шаблон Excel 97 - 2003)
Конвертировать DOCs в XLTM (Шаблон Excel с поддержкой макросов)
Конвертировать DOCs в ODP (Формат презентации OpenDocument)
Конвертировать DOCs в POT (Файлы шаблонов Microsoft PowerPoint)
Конвертировать DOCs в POTM (Файл шаблона Microsoft PowerPoint)
Конвертировать DOCs в POTX (Презентация шаблона Microsoft PowerPoint)
Конвертировать DOCs в PPTX (Формат презентации Open XML)
Конвертировать DOCs в PPS (Слайд-шоу PowerPoint)
Конвертировать DOCs в PPSM (Слайд-шоу с поддержкой макросов)
Конвертировать DOCs в PPSX (Слайд-шоу PowerPoint)
Конвертировать DOCs в PPT (Презентация PowerPoint)
Конвертировать DOCs в PPTM (Файл презентации с поддержкой макросов)
Конвертировать DOCs в PPTX (Формат презентации Open XML)
Конвертировать DOCs в JSON (Файл нотации объектов JavaScript)