Convierta DOC a CSV a través de Java o aplicación en línea

API de Java local para convertir DOC a CSV sin usar Microsoft® Word o Microsoft® Excel

 

Convertir DOC a CSV a través de Aspose.Total for Java es un proceso simple de dos pasos. Mediante el uso de la API de conversión y manipulación de documentos rica en funciones Aspose.Words for Java , puede exportar DOC a HTML. Después de eso, usando Aspose.Cells for Java , puede convertir HTML a CSV.

API de Java para convertir DOC a CSV

  1. Abra el archivo DOC usando la clase Document
  2. Convierta DOC a HTML usando save método
  3. Cargue el documento HTML utilizando la clase Workbook
  4. Guarde el documento en formato CSV mediante save método

Requisitos de conversión

Puede usar fácilmente Aspose.Total para Java directamente desde un proyecto basado en Maven e incluya Aspose.Words for Java y Aspose.Cells for Java en su pom.xml.

Alternativamente, puede obtener un archivo ZIP de descargas .

Convertidor en línea gratuito para DOC a CSV

Requisitos de conversión

Antes de convertir DOC a CSV, puede eliminar la información no utilizada del documento DOC a través de Aspose.Words for Java . En ocasiones, es posible que deba eliminar información no utilizada o duplicada para reducir el tamaño del documento de salida y el tiempo de procesamiento. La clase CleanupOptions le permite especificar opciones para la limpieza de documentos. Para eliminar estilos duplicados o simplemente estilos o listas no utilizados del documento, puede usar el método Cleanup . Puede usar UnusedStyles y UnusedBuiltinStyles para detectar y eliminar estilos marcados como “sin usar”.

Eliminar información no utilizada de un documento DOC a través de Java

Después de convertir DOC a CSV, Aspose.Cells for Java le permite guardar su documento para transmitir. Si necesita guardar archivos en un flujo, debe crear un objeto FileOutputStream y luego save el archivo a ese objeto Stream llamando al método de guardado de Workbook objeto.

Explore DOC opciones de conversión con Java

Convertir DOCs a DIF (Formato de intercambio de datos)
Convertir DOCs a EXCEL (Formatos de archivo de hoja de cálculo)
Convertir DOCs a FODS (Hoja de cálculo XML plano de OpenDocument)
Convertir DOCs a ODS (Hoja de cálculo de OpenDocument)
Convertir DOCs a SXC (Hoja de cálculo de cálculo de StarOffice)
Convertir DOCs a TSV (Valores separados por tabuladores)
Convertir DOCs a XLAM (Complemento de Excel habilitado para macros)
Convertir DOCs a XLS (Formato binario de Microsoft Excel)
Convertir DOCs a XLSB (Libro binario de Excel)
Convertir DOCs a XLSM (Hoja de cálculo habilitada para macros)
Convertir DOCs a XLSX (Libro de trabajo XML abierto)
Convertir DOCs a XLT (Excel 97 - Plantilla 2003)
Convertir DOCs a XLTM (Plantilla de Excel habilitada para macros)
Convertir DOCs a XLTX (Plantilla de Excel)
Convertir DOCs a JSON (Archivo de notación de objetos de JavaScript)
Convertir DOCs a ODP (Formato de presentación de OpenDocument)
Convertir DOCs a POT (Archivos de plantilla de Microsoft PowerPoint)
Convertir DOCs a POTM (Archivo de plantilla de Microsoft PowerPoint)
Convertir DOCs a POTX (Presentación de plantilla de Microsoft PowerPoint)
Convertir DOCs a PPTX (Formato de presentación XML abierto)
Convertir DOCs a PPS (Presentación de diapositivas de PowerPoint)
Convertir DOCs a PPSM (Presentación de diapositivas habilitada para macros)
Convertir DOCs a PPSX (Presentación de diapositivas de PowerPoint)
Convertir DOCs a PPT (Presentación de Powerpoint)
Convertir DOCs a PPTM (Archivo de presentación habilitado para macros)
Convertir DOCs a PPTX (Formato de presentación XML abierto)

Qué es DOC Formato de archivo

El formato de archivo binario (DOC) de Microsoft Word es un formato de archivo de documento propietario empleado por Microsoft Office Word. Representa una estructura de documento que es independiente de cualquier arquitectura informática o sistema operativo específico. El formato DOC sirve como un archivo contenedor, utilizando un formato binario para almacenar varios tipos de datos, incluidos texto formateado, imágenes, gráficos y más. La naturaleza binaria del formato DOC hace que no sea legible por humanos, pero existen varios programas, como Microsoft Word y LibreOffice, que pueden leer y escribir en archivos DOC.

El formato DOC fue inicialmente introducido en Word para Windows 2.0 en 1987. Ha sufrido varias revisiones desde entonces, siendo la iteración más reciente el formato Office Open XML introducido en Office 2007. Una de las principales ventajas del formato DOC radica en su compatibilidad con Microsoft Word. , una de las aplicaciones de procesamiento de textos más utilizadas a nivel mundial. Esta compatibilidad permite a los usuarios crear y modificar documentos utilizando Microsoft Word y compartirlos convenientemente con otras personas que también utilizan la aplicación. Además, muchas otras aplicaciones de procesamiento de texto tienen la capacidad de leer y escribir en el formato DOC, lo que lo convierte en una opción versátil para compartir documentos.

La adopción generalizada del formato DOC se deriva de su integración con Microsoft Word , proporcionando a los usuarios un entorno sólido y rico en funciones para crear y administrar documentos. La flexibilidad del formato se extiende más allá de Microsoft Word, lo que permite a los usuarios trabajar con archivos DOC utilizando un software de procesamiento de texto alternativo. Esta versatilidad garantiza la colaboración y el intercambio de documentos sin inconvenientes entre los usuarios, independientemente de la aplicación de procesamiento de texto que elijan.

Qué es CSV Formato de archivo

Un archivo CSV (valores separados por comas) es un formato comúnmente utilizado para almacenar datos tabulares, similar a una hoja de cálculo o una base de datos. Consta de datos separados por comas, donde cada fila representa un registro. Los archivos CSV se pueden abrir en editores de texto como Microsoft Notepad o Apple TextEdit, así como en programas de hojas de cálculo como Microsoft Excel o Apple Numbers.

Cuando se abren en un editor de texto, los datos CSV se muestran en formato de tabla. Las columnas están separadas por comas y cada fila está separada por una nueva línea. La primera fila, conocida como fila de encabezado, contiene los nombres de las columnas.

Los archivos CSV permiten un fácil intercambio de datos entre diferentes aplicaciones. Los datos pueden exportarse desde programas de hojas de cálculo como Excel o Numbers y guardarse en formato CSV. Del mismo modo, los archivos CSV se pueden importar a estos programas, lo que permite transferir datos de un sistema a otro.

Los archivos CSV ofrecen flexibilidad y compatibilidad debido a su estructura simple y universal. Se utilizan ampliamente para la migración de datos, el intercambio de información entre plataformas y la integración de datos de varias fuentes. La naturaleza sencilla de los archivos CSV los hace accesibles para la manipulación, el análisis y el procesamiento de datos por parte de humanos y sistemas informáticos.