Transforme PDF a RTF a través de Java

API de Java en las instalaciones para renderizar PDF a RTF sin usar ninguna aplicación de terceros

 

Puede convertir PDF a RTF siguiendo dos simples pasos. Primero debe procesar el archivo PDF en DOC usando Aspose.PDF para Java . Después de eso, al usar la poderosa API de procesamiento de documentos Aspose.Words for Java , puede convertir DOC a RTF. Ambas API se incluyen en el paquete Aspose.Total for Java .

API de Java para convertir PDF a RTF

  1. Abra el archivo PDF usando la clase Document
  2. Convierta PDF a DOC usando save método
  3. Cargue el archivo DOC usando la clase Document de Aspose.Words
  4. Guarde el documento en formato RTF usando el método save y configure RTF como Guardar formato

Requisitos de conversión

Puede usar fácilmente Aspose.Total para Java directamente desde un proyecto basado en Maven pdf/java/installation/) y Aspose.Words para Java en su pom.xml.

Alternativamente, puede obtener un archivo ZIP de descargas .

// load PDF file with an instance of Document class
Document document = new Document("template.pdf");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.RTF
outputDocument.save("output.rtf", SaveFormat.RTF);   

Requisitos de conversión

Mientras convierte PDF a RTF, incluso si su documento está protegido con contraseña, aún puede abrirlo usando la API de manipulación de PDF Aspose.PDF para Java . Para abrir el archivo cifrado, debe crear un objeto Document y abrir el PDF con la contraseña del propietario.

// open encrypted document
Document document = new Document("input.pdf", "password");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC);

Abrir documento PDF protegido con contraseña a través de Java

Mientras guarda su documento de entrada en formato de archivo RTF, también puede guardar su documento en una base de datos en lugar de un sistema de archivos. Es posible que deba implementar el almacenamiento y la recuperación de objetos de documento hacia y desde una base de datos. Esto sería necesario si estuviera implementando cualquier tipo de sistema de gestión de contenido. Para guardar su RTF en la base de datos, a menudo es necesario serializar el documento para obtener una matriz de bytes. Esto se puede hacer usando la API Aspose.Words for Java . Después de obtener su matriz de bytes, puede almacenarla en la base de datos usando una declaración SQL.

public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
    // create an output stream which uses byte array to save data
    ByteArrayOutputStream aout = new ByteArrayOutputStream();
    // save the document to byte array
    doc.save(aout, SaveFormat.RTF);
    // get the byte array from output steam
    // the byte array now contains the document
    byte[] buffer = aout.toByteArray();
    // get the filename from the document.
    String fileName = doc.getOriginalFileName();
    String filePath = fileName.replace("\\", "\\\\");
    // create the SQL command.
    String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
    Statement statement = mConnection.createStatement();
    statement.executeUpdate(commandString);
}  

Explore PDF opciones de conversión con Java

Convertir PDFs a DOCM (Archivo Marco de Microsoft Word 2007)
Convertir PDFs a DOT (Archivos de plantilla de Microsoft Word)
Convertir PDFs a DOTM (Archivo de plantilla de Microsoft Word 2007+)
Convertir PDFs a DOTX (Archivo de plantilla de Microsoft Word)
Convertir PDFs a FLATOPC (Microsoft Word 2003 WordprocessingML)
Convertir PDFs a GIF (Formato de intercambio gráfico)
Convertir PDFs a MARKDOWN (Lenguaje de marcado ligero)
Convertir PDFs a ODT (Formato de archivo de texto de OpenDocument)
Convertir PDFs a OTT (Plantilla de documento abierto)
Convertir PDFs a PCL (Lenguaje de comandos de la impresora)
Convertir PDFs a PS (Archivo PostScript)
Convertir PDFs a WORDML (Microsoft Word 2003 WordprocessingML)
Convertir PDFs a XAMLFLOW (Automatización de energía de Microsoft)
Convertir PDFs a CSV (Valores separados por comas)
Convertir PDFs a DIF (Formato de intercambio de datos)
Convertir PDFs a EXCEL (Formatos de archivo de hoja de cálculo)
Convertir PDFs a FODS (Hoja de cálculo XML plano de OpenDocument)
Convertir PDFs a MD (Lenguaje de rebajas)
Convertir PDFs a ODS (Hoja de cálculo de OpenDocument)
Convertir PDFs a SXC (Hoja de cálculo de cálculo de StarOffice)
Convertir PDFs a TSV (Valores separados por tabuladores)
Convertir PDFs a TXT (Documento de texto)
Convertir PDFs a XLAM (Complemento de Excel habilitado para macros)
Convertir PDFs a XLSB (Libro binario de Excel)
Convertir PDFs a XLSM (Hoja de cálculo habilitada para macros)
Convertir PDFs a XLT (Excel 97 - Plantilla 2003)
Convertir PDFs a XLTM (Plantilla de Excel habilitada para macros)
Convertir PDFs a XLTX (Plantilla de Excel)
Convertir PDFs a APNG (Gráficos de red portátiles animados)
Convertir PDFs a DICOM (Imágenes digitales y comunicaciones en medicina)
Convertir PDFs a DXF (Formato de intercambio de dibujos de Autodesk)
Convertir PDFs a EMZ (Metarchivo mejorado comprimido de Windows)
Convertir PDFs a IMAGE (Archivos de imagen)
Convertir PDFs a JPEG2000 (Formato de imagen J2K)
Convertir PDFs a ODP (Formato de presentación de OpenDocument)
Convertir PDFs a OTP (Formato estándar de OpenDocument)
Convertir PDFs a POT (Archivos de plantilla de Microsoft PowerPoint)
Convertir PDFs a POTM (Archivo de plantilla de Microsoft PowerPoint)
Convertir PDFs a POTX (Presentación de plantilla de Microsoft PowerPoint)

Qué es PDF Formato de archivo

PDF, o formato de documento portátil, es un formato de archivo diseñado para presentar documentos de manera que se mantenga consistente en varias aplicaciones de software, dispositivos de hardware y sistemas operativos. Cada archivo PDF contiene una descripción completa de un documento de diseño fijo, que incluye texto, fuentes, gráficos y otra información necesaria para una visualización precisa. Inicialmente desarrollado por Adobe Systems a principios de la década de 1990, PDF servía como un medio para compartir documentos de computadora mientras conservaba el formato de texto y las imágenes en línea.

Los archivos PDF generalmente se generan utilizando software como Adobe Acrobat o herramientas de creación de PDF similares. En la actualidad, PDF se ha convertido en un estándar abierto regido por la Organización Internacional de Normalización (ISO). Esta estandarización garantiza la compatibilidad y la interoperabilidad entre diferentes plataformas y sistemas. Para ver archivos PDF, los usuarios pueden utilizar software gratuito como Adobe Reader u otros visores de PDF disponibles.

Una de las ventajas significativas de PDF es su independencia de plataforma, lo que permite una visualización e impresión perfectas en una amplia gama de dispositivos y sistemas operativos. Independientemente del hardware o software utilizado, el diseño y el contenido del documento permanecerán intactos. Esta accesibilidad universal ha contribuido a la popularidad de PDF como formato preferido para compartir y distribuir documentos a través de diversas plataformas y sistemas.

La capacidad de PDF para encapsular un documento completo, incluidos texto, fuentes, gráficos y formato, hace Es una opción confiable para diversas aplicaciones. Ya sea para compartir informes importantes, publicar libros electrónicos, distribuir formularios o realizar presentaciones profesionales, PDF garantiza una representación uniforme de los documentos y una conservación fiable del contenido en diferentes entornos.

Qué es RTF Formato de archivo

El formato de archivo RTF (Rich Text Format) es un formato de archivo versátil y ampliamente compatible para almacenar documentos de texto con formato. Fue desarrollado por Microsoft a fines de la década de 1980 como un formato multiplataforma que podía intercambiarse fácilmente entre diferentes aplicaciones de procesamiento de texto.

Los archivos RTF generalmente se guardan con la extensión de archivo .rtf y pueden abrirse y editarse varios editores de texto y software de procesamiento de textos, incluidos Microsoft Word, Google Docs y LibreOffice. El formato permite la inclusión de varios elementos de formato, como estilos de fuente, tamaños, colores, párrafos, tablas e imágenes.

Una de las principales ventajas de RTF es su independencia de plataforma, lo que significa que un RTF El archivo creado en un sistema operativo se puede abrir y procesar correctamente en otro sin perder el formato. Esto lo convierte en la opción preferida para el intercambio de documentos y la colaboración.

Los archivos RTF utilizan una sintaxis de formato de texto sin formato, lo que significa que los archivos son legibles por humanos y se pueden modificar con un editor de texto si es necesario. Sin embargo, los archivos RTF pueden tener un tamaño bastante grande en comparación con otros formatos como texto sin formato o Markdown, ya que almacenan información de formato explícitamente.

Si bien RTF se usa principalmente para documentos de texto, también puede admitir la incrustación de otros tipos de archivos, como imágenes y objetos, dentro del documento. Esto permite la creación de documentos más complejos y visualmente atractivos.