Transforme PDF em RTF via Java

On Premise Java API para renderizar PDF para RTF sem usar nenhum aplicativo de terceiros

 

Você pode converter PDF para RTF usando duas etapas simples. Primeiro você precisa renderizar o arquivo PDF para DOC usando Aspose.PDF for Java . Depois disso, usando a poderosa API de processamento de documentos Aspose.Words for Java , você pode converter DOC para RTF. Ambas as APIs estão no pacote Aspose.Total for Java .

API Java para converter PDF em RTF

  1. Abra o arquivo PDF usando a classe Document
  2. Converta PDF para DOC usando salvar método
  3. Carregue o arquivo DOC usando a classe Document de Aspose.Words
  4. Salve o documento no formato RTF usando o método save e defina o RTF como SalvarFormato

Requisitos de conversão

Você pode facilmente usar o Aspose.Total para Java diretamente de um projeto baseado em Maven e inclua Aspose.PDF for Java e Aspose.Words for Java em seu pom.xml.

Como alternativa, você pode obter um arquivo ZIP em downloads .

// load PDF file with an instance of Document class
Document document = new Document("template.pdf");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.RTF
outputDocument.save("output.rtf", SaveFormat.RTF);   

Requisitos de conversão

Ao converter PDF para RTF, mesmo que seu documento esteja protegido por senha, você ainda pode abri-lo usando a API de manipulação de PDF Aspose.PDF for Java . Para abrir o arquivo criptografado, você precisa criar um objeto Document e abrir o PDF usando a senha do proprietário.

// open encrypted document
Document document = new Document("input.pdf", "password");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC);

Abrir documento PDF protegido por senha via Java

Ao salvar seu documento de entrada no formato de arquivo RTF, você também pode salvar seu documento no banco de dados em vez de em um sistema de arquivos. Pode ser necessário implementar o armazenamento e a recuperação de objetos Document de e para um banco de dados. Isso seria necessário se você estivesse implementando qualquer tipo de sistema de gerenciamento de conteúdo. Para salvar seu RTF no banco de dados, muitas vezes é necessário serializar o documento para obter uma matriz de bytes. Isso pode ser feito usando a API Aspose.Words for Java . Depois de obter sua matriz de bytes, você pode armazená-la no banco de dados usando a instrução SQL.

public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
    // create an output stream which uses byte array to save data
    ByteArrayOutputStream aout = new ByteArrayOutputStream();
    // save the document to byte array
    doc.save(aout, SaveFormat.RTF);
    // get the byte array from output steam
    // the byte array now contains the document
    byte[] buffer = aout.toByteArray();
    // get the filename from the document.
    String fileName = doc.getOriginalFileName();
    String filePath = fileName.replace("\\", "\\\\");
    // create the SQL command.
    String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
    Statement statement = mConnection.createStatement();
    statement.executeUpdate(commandString);
}  

Explore PDF Opções de conversão com Java

Converter PDFs para DOCM (Arquivo Marco do Microsoft Word 2007)
Converter PDFs para DOT (Arquivos de modelo do Microsoft Word)
Converter PDFs para DOTM (Arquivo de modelo do Microsoft Word 2007+)
Converter PDFs para DOTX (Arquivo de modelo do Microsoft Word)
Converter PDFs para FLATOPC (Microsoft Word 2003 WordprocessingML)
Converter PDFs para GIF (Formato de Intercâmbio Gráfico)
Converter PDFs para MARKDOWN (Linguagem de Marcação Leve)
Converter PDFs para ODT (Formato de Arquivo de Texto OpenDocument)
Converter PDFs para OTT (Modelo OpenDocument)
Converter PDFs para PCL (Linguagem de Comando da Impressora)
Converter PDFs para PS (Arquivo PostScript)
Converter PDFs para WORDML (Microsoft Word 2003 WordprocessingML)
Converter PDFs para XAMLFLOW (Power Automate da Microsoft)
Converter PDFs para CSV (Valores separados por vírgula)
Converter PDFs para DIF (Formato de Intercâmbio de Dados)
Converter PDFs para EXCEL (Formatos de arquivo de planilha)
Converter PDFs para FODS (Planilha XML Plana OpenDocument)
Converter PDFs para MD (Linguagem de Remarcação)
Converter PDFs para ODS (Planilha OpenDocument)
Converter PDFs para SXC (Planilha do StarOffice Calc)
Converter PDFs para TSV (Valores separados por tabulações)
Converter PDFs para TXT (Documento de texto)
Converter PDFs para XLAM (Suplemento habilitado para macro do Excel)
Converter PDFs para XLSB (Pasta de trabalho binária do Excel)
Converter PDFs para XLSM (Planilha habilitada para macro)
Converter PDFs para XLT (Modelo Excel 97 - 2003)
Converter PDFs para XLTM (Modelo habilitado para macro do Excel)
Converter PDFs para XLTX (Modelo do Excel)
Converter PDFs para APNG (Gráficos Animados de Rede Portátil)
Converter PDFs para DICOM (Imagem Digital e Comunicações em Medicina)
Converter PDFs para DXF (Formato de troca de desenho da Autodesk)
Converter PDFs para EMZ (Metarquivo Aprimorado Compactado do Windows)
Converter PDFs para IMAGE (Arquivos de imagem)
Converter PDFs para JPEG2000 (Formato de Imagem J2K)
Converter PDFs para ODP (Formato de Apresentação OpenDocument)
Converter PDFs para OTP (Formato Padrão do OpenDocument)
Converter PDFs para POT (Arquivos de modelo do Microsoft PowerPoint)
Converter PDFs para POTM (Arquivo de modelo do Microsoft PowerPoint)
Converter PDFs para POTX (Modelo de apresentação do Microsoft PowerPoint)

O que é PDF Formato de Arquivo

PDF, ou Portable Document Format, é um formato de arquivo projetado para apresentar documentos de maneira que permaneça consistente em vários aplicativos de software, dispositivos de hardware e sistemas operacionais. Cada arquivo PDF contém uma descrição abrangente de um documento de layout fixo, abrangendo texto, fontes, gráficos e outras informações necessárias para exibição precisa. Inicialmente desenvolvido pela Adobe Systems no início dos anos 1990, o PDF servia como um meio de compartilhar documentos de computador, preservando a formatação do texto e as imagens embutidas.

Arquivos PDF são normalmente gerados usando software como Adobe Acrobat ou ferramentas de criação de PDF semelhantes. Atualmente, o PDF tornou-se um padrão aberto regido pela Organização Internacional de Padronização (ISO). Essa padronização garante compatibilidade e interoperabilidade entre diferentes plataformas e sistemas. Para visualizar arquivos PDF, os usuários podem utilizar software gratuito, como o Adobe Reader ou outros visualizadores de PDF disponíveis.

Uma das vantagens significativas do PDF é sua independência de plataforma, permitindo visualização e impressão contínuas em uma ampla variedade de dispositivos e sistemas operacionais. Independentemente do hardware ou software utilizado, o layout e o conteúdo do documento permanecerão intactos. Essa acessibilidade universal contribuiu para a popularidade do PDF como formato preferencial para compartilhamento e distribuição de documentos em diversas plataformas e sistemas.

A capacidade do PDF de encapsular um documento completo, incluindo texto, fontes, gráficos e formatação, torna é uma escolha confiável para várias aplicações. Seja compartilhando relatórios importantes, publicando e-books, distribuindo formulários ou fazendo apresentações profissionais, o PDF garante a renderização consistente do documento e a preservação confiável do conteúdo em diferentes ambientes.

O que é RTF Formato de Arquivo

O formato de arquivo RTF (Rich Text Format) é um formato de arquivo versátil e amplamente suportado para armazenar documentos de texto com formatação. Ele foi desenvolvido pela Microsoft no final dos anos 80 como um formato de plataforma cruzada que pode ser facilmente trocado entre diferentes aplicativos de processamento de texto.

Arquivos RTF são normalmente salvos com a extensão de arquivo .rtf e podem ser abertos e editados por vários editores de texto e software de processamento de texto, incluindo Microsoft Word, Google Docs e LibreOffice. O formato permite a inclusão de vários elementos de formatação, como estilos de fonte, tamanhos, cores, parágrafos, tabelas e imagens.

Uma das principais vantagens do RTF é sua independência de plataforma, o que significa que um RTF arquivo criado em um sistema operacional pode ser aberto e renderizado corretamente em outro sem perder a formatação. Isso o torna a escolha preferida para troca de documentos e colaboração.

Arquivos RTF usam uma sintaxe de formatação de texto simples, o que significa que os arquivos são legíveis por humanos e podem ser modificados com um editor de texto, se necessário. No entanto, os arquivos RTF podem ser muito grandes em tamanho em comparação com outros formatos, como texto simples ou Markdown, pois armazenam informações de formatação explicitamente.

Embora o RTF seja usado principalmente para documentos de texto, ele também pode suportar a incorporação de outros tipos de arquivos, como imagens e objetos, dentro do documento. Isso permite a criação de documentos mais complexos e visualmente atraentes.