Conversor de formato PDF via PHP via Java

Exporte PDF para Word, Excel, PowerPoint, imagens, HTML e formatos de layout fixo usando PHP via Java

Visão geral

Há poucos casos em que é necessário manipular documentos que não sejam PDF e, ao mesmo tempo, ter os dados de análise disponíveis em formatos PDF. Portanto, para esses aplicativos, haverá dois cenários: ou eles adicionam a funcionalidade de análise de PDF em sua solução ou adicionam a funcionalidade de conversão de PDF para manipular dados como formatos suportados. Para o segundo cenário de converter PDF em Word, Excel, HTML, imagens ou qualquer formato necessário, implementar o leitor e conversor PHP para código PDF em código baseado em Java é simples. Estamos discutindo alguns casos aqui para que os programadores possam modificar esses trechos de código de conversão de acordo com seus requisitos.

Conversão de PDF para Microsoft Word

Exemplo de PHP: código para conversão de PDF para Word

// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");

// Import the necessary classes from the Aspose.PDF for Java library
use com\aspose\pdf\License;
use com\aspose\pdf\Document;
use com\aspose\pdf\DocSaveOptions;
use com\aspose\pdf\DocSaveOptions_DocFormat;
use com\aspose\pdf\DocSaveOptions_RecognitionMode;

// Set the license file for Aspose.PDF for Java
$license = "Aspose.PDF.PHPviaJava.lic";
$licenceObject = new License();
$licenceObject->setLicense($license);

// Set the input and output file paths
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'result-pdf-to-docx.docx';

// Load the PDF document
$document = new Document($inputFile);

// Create the save options for converting to DOCX format
$saveOption = new DocSaveOptions();
$saveOption->setMode(DocSaveOptions_RecognitionMode::$EnhancedFlow);
$saveOption->setFormat(DocSaveOptions_DocFormat::$DocX);

// Save the document in DOCX format
$document->save($outputFile, $saveOption);

A biblioteca Aspose.PDF for PHP suporta todas as conversões de PDF para Word. Caso estejamos apenas convertendo documentos do Microsoft Word sem nenhuma configuração especial, basta carregar o arquivo PDF usando o método Salvar da classe Documento e usaremos o caminho do documento Word de saída e SaveFormat como parâmetros. Para os casos especiais em que é necessário aprimorar a distância das linhas, a resolução da imagem e mais configurações, a API tem a classe DocSaveOptions que expõe todas essas configurações.

Salvar PDF como arquivos do Excel

Exemplo de PHP: código para conversão de PDF em Excel

// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");

// Import the necessary classes from the Aspose.PDF for Java library
use com\aspose\pdf\Document;
use com\aspose\pdf\ExcelSaveOptions;
use com\aspose\pdf\ExcelSaveOptions_ExcelFormat;
use com\aspose\pdf\License;

// Set the path to the Aspose.PDF license file
$license = "Aspose.PDF.PHPviaJava.lic";

// Create a new License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense($license);

// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";

// Set the path to the output Excel file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'sample.xlsx';

// Create a new Document object and load the input PDF file
$document = new Document($inputFile);

// Create a new ExcelSaveOptions object
$saveOption = new ExcelSaveOptions();

// Set the output format to XLSX
$saveOption->setFormat(ExcelSaveOptions_ExcelFormat::$XLSX);

// Save the document as an Excel file using the specified save options
$document->save($outputFile, $saveOption);

Enumeração especializada SaveFormat.Excel disponível para salvar PDF em formatos de saída específicos do Microsoft Excel XLS XLSX. Além disso, Biblioteca de PDF PHP/Java também tem uma [classe ExcelSaveOptions] específica (https://apireference.aspose.com/pdf/php-java/aspose.pdf/excelsaveoptions) que não apenas lida com o salvamento em formatos do Excel, mas também fornece funções e propriedades diferentes para definir atributos diferentes, como formato de saída exato, minimizar o número de planilhas e muito mais.

Converter PDF em apresentações do PowerPoint

Exemplo de PHP: conversão de código de PDF para PowerPoint

// Include the required Java and Aspose.PDF for PHP libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");

// Import the necessary classes from the Aspose.PDF for PHP library
use com\aspose\pdf\Document;
use com\aspose\pdf\PptxSaveOptions;
use com\aspose\pdf\License;

// Set the path to the Aspose.PDF license file
$license = "Aspose.PDF.PHPviaJava.lic";

// Create a new License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense($license);

// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";

// Set the path to the output PPTX file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . "results" . DIRECTORY_SEPARATOR . 'sample.pptx';

// Load the input PDF document
$document = new Document($inputFile);

// Create an instance of PptxSaveOptions
$saveOption = new PptxSaveOptions();

// Save the PDF document as a PPTX file
$document->save($outputFile, $saveOption);

A API PHP suporta a conversão de páginas PDF em slides de apresentação do PowerPoint com texto ou imagens selecionáveis, renderizando slides como imagens. O padrão de salvar o formato de documento portátil no PowerPoint é quase o mesmo, carregando o arquivo usando a classe Document e chamando o método Save com o caminho do arquivo de saída e SaveFormat como parâmetros. No caso de renderização com opções especiais de apresentação, os programadores podem usar classe pptxSaveOptions com qualquer opção de renderização específica relevante. Chamando o método save e passando as opções como parâmetro.

Conversão de PDF para HTML

Exemplo de PHP: código para conversão de PDF em HTML

// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");

// Import the necessary classes from the Aspose.PDF library
use com\aspose\pdf\Document;
use com\aspose\pdf\HtmlSaveOptions;
use com\aspose\pdf\License;

// Set the path to the license file
$licensePath = "Aspose.PDF.PHPviaJava.lic";

// Create a new License object and set the license using the provided file path
$license = new License();
$license->setLicense($licensePath);

// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";

// Set the path to the output HTML file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'pdf-to-html.html';

// Create a new Document object and load the input PDF file
$document = new Document($inputFile);

// Create a new HtmlSaveOptions object for saving the document as HTML
$saveOption = new HtmlSaveOptions();

// Save the document as HTML using the specified save options
$document->save($outputFile, $saveOption);

A Biblioteca de Análise de PDF suporta o salvamento de PDF em HTML como um todo, bem como com recursos incorporados, incluindo imagens. O procedimento de conversão é o mesmo do PDF para outros formatos para casos genéricos, como carregar o documento de origem e chamar o método Salvar com o caminho do arquivo HTML de saída e SaveFormat.Html como parâmetros. No caso de salvar com recursos incorporados, há uma classe HTMLSaveOptions com várias opções, como salvar imagens em uma pasta específica durante a conversão, dividir o HTML resultante em várias páginas e muito mais.

Converter PDF em imagens

Exemplo de PHP: Código para conversão de PDF em imagens

// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");

// Import the necessary classes from the Aspose.PDF for PHP via Java library
use com\aspose\pdf\Document;
use com\aspose\pdf\devices_Resolution;
use com\aspose\pdf\devices_JpegDevice;
use com\aspose\pdf\License;

// Create a License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense("Aspose.PDF.PHPviaJava.lic");

// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";

// Set the path and template for the output JPEG files
$imageFileNameTemplate = $dataDir . DIRECTORY_SEPARATOR . 'pdf-to-jpeg-';

// Open the target document
$document = new Document($inputFile);
$pages = $document->getPages();
$count = $pages->size();

// Create a Resolution object with a resolution of 300 dpi
$resolution = new devices_Resolution(300);

// Create a JpegDevice object with the specified resolution
$imageDevice = new devices_JpegDevice($resolution);

// Loop through each page of the document
for ($pageCount = 1; $pageCount <= $document->getPages()->size(); $pageCount++) {
    // Convert a particular page and save the image to a file
    $imageFileName = $imageFileNameTemplate . $pageCount . '.jpg';
    $page = $document->getPages()->get_Item($pageCount);
    $imageDevice->process($page, $imageFileName);
}

Converter páginas PDF em imagens, incluindo PNG, JPEG, TIFF, BMP etc. é fácil em aplicativos baseados em Java usando trechos de código listados abaixo. Os desenvolvedores podem percorrer as páginas do PDF após carregar o arquivo e converter página por página no formato de imagem necessário. Os desenvolvedores podem definir a resolução horizontal e vertical das imagens usando Classe de resolução