Конвертировать DOC в CSV через Java или онлайн-приложение

Локальный Java API для преобразования DOC в CSV без использования Microsoft® Word или Microsoft® Excel

 

Преобразование DOC в CSV с помощью Aspose.Total для Java — это простой двухэтапный процесс. Используя многофункциональный API для обработки и преобразования документов Aspose.Words for Java , вы можете экспортировать DOC в HTML. После этого, используя Aspose.Cells for Java , вы можете конвертировать HTML в CSV.

Java API для преобразования DOC в CSV

  1. Откройте файл DOC, используя класс Document .
  2. Преобразуйте DOC в HTML, используя Сохранить метод
  3. Загрузите HTML-документ с помощью класса Workbook .
  4. Сохраните документ в формате CSV с помощью save метод

Требования к конвертации

Вы можете легко использовать Aspose.Total для Java непосредственно из проекта на основе Maven . и включите Aspose.Words для Java и Aspose.Cells для Java в вашем pom.xml.

Кроме того, вы можете получить ZIP-файл из загрузки .

Бесплатный онлайн-конвертер DOC в CSV

Требования к конвертации

Перед преобразованием DOC в CSV вы можете удалить неиспользуемую информацию из документа DOC через Aspose.Words for Java . Иногда может потребоваться удалить неиспользуемую или повторяющуюся информацию, чтобы уменьшить размер выходного документа и время обработки. Класс CleanupOptions позволяет указать параметры очистки документа. Чтобы удалить повторяющиеся стили или просто неиспользуемые стили или списки из документа, вы можете использовать метод Очистка . Вы можете использовать UnusedStyles и UnusedBuiltinStyles для обнаружения и удаления стилей, помеченных как «неиспользуемые».

Удалить неиспользуемую информацию из документа DOC через Java

После преобразования DOC в CSV Aspose.Cells for Java позволяет сохранить документ для потоковой передачи. Если вам нужно сохранить файлы в поток, вам следует создать объект FileOutputStream, а затем save файл в этот объект Stream, вызвав метод сохранения Workbook объект.

Исследуйте варианты преобразования DOC с Java

Конвертировать DOCs в DIF (Формат обмена данными)
Конвертировать DOCs в EXCEL (Форматы файлов электронных таблиц)
Конвертировать DOCs в FODS (Плоская XML-таблица OpenDocument)
Конвертировать DOCs в ODS (Электронная таблица OpenDocument)
Конвертировать DOCs в SXC (Электронная таблица StarOffice Calc)
Конвертировать DOCs в TSV (Значения, разделенные табуляцией)
Конвертировать DOCs в XLAM (Надстройка Excel с поддержкой макросов)
Конвертировать DOCs в XLS (Двоичный формат Microsoft Excel)
Конвертировать DOCs в XLSB (Двоичная книга Excel)
Конвертировать DOCs в XLSM (Электронная таблица с поддержкой макросов)
Конвертировать DOCs в XLSX (Открытая XML-книга)
Конвертировать DOCs в XLT (Шаблон Excel 97 - 2003)
Конвертировать DOCs в XLTM (Шаблон Excel с поддержкой макросов)
Конвертировать DOCs в ODP (Формат презентации OpenDocument)
Конвертировать DOCs в POT (Файлы шаблонов Microsoft PowerPoint)
Конвертировать DOCs в POTM (Файл шаблона Microsoft PowerPoint)
Конвертировать DOCs в POTX (Презентация шаблона Microsoft PowerPoint)
Конвертировать DOCs в PPTX (Формат презентации Open XML)
Конвертировать DOCs в PPS (Слайд-шоу PowerPoint)
Конвертировать DOCs в PPSM (Слайд-шоу с поддержкой макросов)
Конвертировать DOCs в PPSX (Слайд-шоу PowerPoint)
Конвертировать DOCs в PPT (Презентация PowerPoint)
Конвертировать DOCs в PPTM (Файл презентации с поддержкой макросов)
Конвертировать DOCs в PPTX (Формат презентации Open XML)
Конвертировать DOCs в JSON (Файл нотации объектов JavaScript)

Формат файла DOC

Формат двоичных файлов Microsoft Word (DOC) — это проприетарный формат файлов документов, используемый Microsoft Office Word. Он представляет собой структуру документа, которая не зависит от какой-либо конкретной компьютерной архитектуры или операционной системы. Формат DOC служит файлом-контейнером, использующим двоичный формат для хранения различных типов данных, включая форматированный текст, изображения, диаграммы и многое другое. Двоичный характер формата DOC делает его нечитаемым для человека, но существует несколько программ, таких как Microsoft Word и LibreOffice, которые могут как читать файлы DOC, так и записывать в них.

Формат DOC изначально был представлен в Word для Windows 2.0 еще в 1987 году. С тех пор он претерпел несколько изменений, последней из которых стал формат Office Open XML, представленный в Office 2007. Одно из ключевых преимуществ формата DOC заключается в его совместимости с Microsoft Word. , одно из наиболее широко используемых приложений для обработки текстов во всем мире. Эта совместимость позволяет пользователям создавать и изменять документы с помощью Microsoft Word и удобно делиться ими с другими пользователями, которые также используют это приложение. Кроме того, многие другие приложения для обработки текстов обладают возможностью чтения и записи в формате DOC, что делает его универсальным выбором для обмена документами.

Широкое распространение формата DOC связано с его интеграцией с Microsoft Word. , предоставляя пользователям надежную и многофункциональную среду для создания документов и управления ими. Гибкость формата выходит за рамки Microsoft Word, позволяя пользователям работать с файлами DOC с помощью альтернативного программного обеспечения для обработки текстов. Эта универсальность обеспечивает беспрепятственную совместную работу с документами и взаимозаменяемость между пользователями, независимо от выбранного ими текстового редактора.

Формат файла CSV

Файл CSV (значения, разделенные запятыми) — это широко используемый формат для хранения табличных данных, напоминающий электронную таблицу или базу данных. Он состоит из данных, разделенных запятыми, где каждая строка представляет собой запись. Файлы CSV можно открывать в текстовых редакторах, таких как Microsoft Notepad или Apple TextEdit, а также в программах для работы с электронными таблицами, таких как Microsoft Excel или Apple Numbers.

При открытии в текстовом редакторе данные CSV отображаются в формате таблицы. Столбцы разделяются запятыми, а каждая строка отделяется новой строкой. Первая строка, известная как строка заголовка, содержит имена столбцов.

Файлы CSV позволяют легко обмениваться данными между различными приложениями. Данные можно экспортировать из программ для работы с электронными таблицами, таких как Excel или Numbers, и сохранять в формате CSV. Точно так же файлы CSV можно импортировать в эти программы, что позволяет передавать данные из одной системы в другую.

Файлы CSV обеспечивают гибкость и совместимость благодаря своей простой и универсальной структуре. Они широко используются для переноса данных, обмена информацией между платформами и интеграции данных из различных источников. Простой характер файлов CSV делает их доступными для обработки, анализа и обработки данных как людьми, так и компьютерными системами.