Há poucos casos em que é necessário manipular documentos que não sejam PDF e, ao mesmo tempo, ter os dados de análise disponíveis em formatos PDF. Portanto, para esses aplicativos, haverá dois cenários: ou eles adicionam a funcionalidade de análise de PDF em sua solução ou adicionam a funcionalidade de conversão de PDF para manipular dados como formatos suportados. Para o segundo cenário de converter PDF em Word, Excel, HTML, imagens ou qualquer formato necessário, implementar o leitor e conversor PHP para código PDF em código baseado em Java é simples. Estamos discutindo alguns casos aqui para que os programadores possam modificar esses trechos de código de conversão de acordo com seus requisitos.
Conversão de PDF para Microsoft Word
// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF for Java library
use com\aspose\pdf\License;
use com\aspose\pdf\Document;
use com\aspose\pdf\DocSaveOptions;
use com\aspose\pdf\DocSaveOptions_DocFormat;
use com\aspose\pdf\DocSaveOptions_RecognitionMode;
// Set the license file for Aspose.PDF for Java
$license = "Aspose.PDF.PHPviaJava.lic";
$licenceObject = new License();
$licenceObject->setLicense($license);
// Set the input and output file paths
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'result-pdf-to-docx.docx';
// Load the PDF document
$document = new Document($inputFile);
// Create the save options for converting to DOCX format
$saveOption = new DocSaveOptions();
$saveOption->setMode(DocSaveOptions_RecognitionMode::$EnhancedFlow);
$saveOption->setFormat(DocSaveOptions_DocFormat::$DocX);
// Save the document in DOCX format
$document->save($outputFile, $saveOption);
A biblioteca Aspose.PDF for PHP suporta todas as conversões de PDF para Word. Caso estejamos apenas convertendo documentos do Microsoft Word sem nenhuma configuração especial, basta carregar o arquivo PDF usando o método Salvar da classe Documento e usaremos o caminho do documento Word de saída e SaveFormat como parâmetros. Para os casos especiais em que é necessário aprimorar a distância das linhas, a resolução da imagem e mais configurações, a API tem a classe DocSaveOptions que expõe todas essas configurações.
Salvar PDF como arquivos do Excel
// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF for Java library
use com\aspose\pdf\Document;
use com\aspose\pdf\ExcelSaveOptions;
use com\aspose\pdf\ExcelSaveOptions_ExcelFormat;
use com\aspose\pdf\License;
// Set the path to the Aspose.PDF license file
$license = "Aspose.PDF.PHPviaJava.lic";
// Create a new License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense($license);
// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
// Set the path to the output Excel file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'sample.xlsx';
// Create a new Document object and load the input PDF file
$document = new Document($inputFile);
// Create a new ExcelSaveOptions object
$saveOption = new ExcelSaveOptions();
// Set the output format to XLSX
$saveOption->setFormat(ExcelSaveOptions_ExcelFormat::$XLSX);
// Save the document as an Excel file using the specified save options
$document->save($outputFile, $saveOption);
Enumeração especializada SaveFormat.Excel disponível para salvar PDF em formatos de saída específicos do Microsoft Excel XLS XLSX. Além disso, Biblioteca de PDF PHP/Java também tem uma [classe ExcelSaveOptions] específica (https://apireference.aspose.com/pdf/php-java/aspose.pdf/excelsaveoptions) que não apenas lida com o salvamento em formatos do Excel, mas também fornece funções e propriedades diferentes para definir atributos diferentes, como formato de saída exato, minimizar o número de planilhas e muito mais.
Converter PDF em apresentações do PowerPoint
// Include the required Java and Aspose.PDF for PHP libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF for PHP library
use com\aspose\pdf\Document;
use com\aspose\pdf\PptxSaveOptions;
use com\aspose\pdf\License;
// Set the path to the Aspose.PDF license file
$license = "Aspose.PDF.PHPviaJava.lic";
// Create a new License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense($license);
// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
// Set the path to the output PPTX file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . "results" . DIRECTORY_SEPARATOR . 'sample.pptx';
// Load the input PDF document
$document = new Document($inputFile);
// Create an instance of PptxSaveOptions
$saveOption = new PptxSaveOptions();
// Save the PDF document as a PPTX file
$document->save($outputFile, $saveOption);
A API PHP suporta a conversão de páginas PDF em slides de apresentação do PowerPoint com texto ou imagens selecionáveis, renderizando slides como imagens. O padrão de salvar o formato de documento portátil no PowerPoint é quase o mesmo, carregando o arquivo usando a classe Document e chamando o método Save com o caminho do arquivo de saída e SaveFormat como parâmetros. No caso de renderização com opções especiais de apresentação, os programadores podem usar classe pptxSaveOptions com qualquer opção de renderização específica relevante. Chamando o método save e passando as opções como parâmetro.
Conversão de PDF para HTML
// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF library
use com\aspose\pdf\Document;
use com\aspose\pdf\HtmlSaveOptions;
use com\aspose\pdf\License;
// Set the path to the license file
$licensePath = "Aspose.PDF.PHPviaJava.lic";
// Create a new License object and set the license using the provided file path
$license = new License();
$license->setLicense($licensePath);
// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
// Set the path to the output HTML file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'pdf-to-html.html';
// Create a new Document object and load the input PDF file
$document = new Document($inputFile);
// Create a new HtmlSaveOptions object for saving the document as HTML
$saveOption = new HtmlSaveOptions();
// Save the document as HTML using the specified save options
$document->save($outputFile, $saveOption);
A Biblioteca de Análise de PDF suporta o salvamento de PDF em HTML como um todo, bem como com recursos incorporados, incluindo imagens. O procedimento de conversão é o mesmo do PDF para outros formatos para casos genéricos, como carregar o documento de origem e chamar o método Salvar com o caminho do arquivo HTML de saída e SaveFormat.Html como parâmetros. No caso de salvar com recursos incorporados, há uma classe HTMLSaveOptions com várias opções, como salvar imagens em uma pasta específica durante a conversão, dividir o HTML resultante em várias páginas e muito mais.
Converter PDF em imagens
// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF for PHP via Java library
use com\aspose\pdf\Document;
use com\aspose\pdf\devices_Resolution;
use com\aspose\pdf\devices_JpegDevice;
use com\aspose\pdf\License;
// Create a License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense("Aspose.PDF.PHPviaJava.lic");
// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
// Set the path and template for the output JPEG files
$imageFileNameTemplate = $dataDir . DIRECTORY_SEPARATOR . 'pdf-to-jpeg-';
// Open the target document
$document = new Document($inputFile);
$pages = $document->getPages();
$count = $pages->size();
// Create a Resolution object with a resolution of 300 dpi
$resolution = new devices_Resolution(300);
// Create a JpegDevice object with the specified resolution
$imageDevice = new devices_JpegDevice($resolution);
// Loop through each page of the document
for ($pageCount = 1; $pageCount <= $document->getPages()->size(); $pageCount++) {
// Convert a particular page and save the image to a file
$imageFileName = $imageFileNameTemplate . $pageCount . '.jpg';
$page = $document->getPages()->get_Item($pageCount);
$imageDevice->process($page, $imageFileName);
}
Converter páginas PDF em imagens, incluindo PNG, JPEG, TIFF, BMP etc. é fácil em aplicativos baseados em Java usando trechos de código listados abaixo. Os desenvolvedores podem percorrer as páginas do PDF após carregar o arquivo e converter página por página no formato de imagem necessário. Os desenvolvedores podem definir a resolução horizontal e vertical das imagens usando Classe de resolução