Il existe peu de cas où il est nécessaire de manipuler des documents autres que le PDF tout en ayant les données d’analyse disponibles au format PDF. Ainsi, pour de telles applications, il y aura deux scénarios : soit elles ajoutent la fonctionnalité d’analyse des PDF dans leur solution, soit elles ajoutent la fonctionnalité de conversion PDF pour manipuler les données en tant que formats pris en charge. Dans le second scénario, qui consiste à convertir un PDF en Word, Excel, HTML, Images ou tout autre format requis, il est simple d’implémenter le lecteur et convertisseur PHP pour le code PDF dans du code Java. Nous discutons ici de quelques cas afin que les programmeurs puissent modifier ces extraits de code de conversion en fonction de leurs besoins.
Conversion de PDF en Microsoft Word
// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF for Java library
use com\aspose\pdf\License;
use com\aspose\pdf\Document;
use com\aspose\pdf\DocSaveOptions;
use com\aspose\pdf\DocSaveOptions_DocFormat;
use com\aspose\pdf\DocSaveOptions_RecognitionMode;
// Set the license file for Aspose.PDF for Java
$license = "Aspose.PDF.PHPviaJava.lic";
$licenceObject = new License();
$licenceObject->setLicense($license);
// Set the input and output file paths
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'result-pdf-to-docx.docx';
// Load the PDF document
$document = new Document($inputFile);
// Create the save options for converting to DOCX format
$saveOption = new DocSaveOptions();
$saveOption->setMode(DocSaveOptions_RecognitionMode::$EnhancedFlow);
$saveOption->setFormat(DocSaveOptions_DocFormat::$DocX);
// Save the document in DOCX format
$document->save($outputFile, $saveOption);
La bibliothèque Aspose.PDF pour PHP prend en charge toutes les conversions PDF en Word. Si nous convertissons simplement des documents Microsoft Word sans paramètres particuliers, nous chargeons simplement le fichier PDF à l’aide de la méthode Save de la classe Document et utiliserons le chemin du document Word de sortie et SaveFormat comme paramètres. Pour les cas particuliers où il est nécessaire d’améliorer la distance des lignes, la résolution de l’image et d’autres paramètres, l’API possède la classe DocSaveOptions qui expose tous ces paramètres.
Enregistrer le PDF sous forme de fichiers Excel
// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF for Java library
use com\aspose\pdf\Document;
use com\aspose\pdf\ExcelSaveOptions;
use com\aspose\pdf\ExcelSaveOptions_ExcelFormat;
use com\aspose\pdf\License;
// Set the path to the Aspose.PDF license file
$license = "Aspose.PDF.PHPviaJava.lic";
// Create a new License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense($license);
// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
// Set the path to the output Excel file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'sample.xlsx';
// Create a new Document object and load the input PDF file
$document = new Document($inputFile);
// Create a new ExcelSaveOptions object
$saveOption = new ExcelSaveOptions();
// Set the output format to XLSX
$saveOption->setFormat(ExcelSaveOptions_ExcelFormat::$XLSX);
// Save the document as an Excel file using the specified save options
$document->save($outputFile, $saveOption);
SaveFormat.excel Énumération spécialisée disponible pour enregistrer des fichiers PDF dans des formats de sortie Microsoft Excel XLS XLSX spécifiques. De plus, PHP/Java PDF Library possède également une [classe ExcelSaveOptions] spécifique (https://apireference.aspose.com/pdf/php-java/aspose.pdf/excelsaveoptions) qui non seulement gère l’enregistrement au format Excel, mais fournit également différentes fonctions et propriétés pour définir différents attributs tels que le format de sortie exact, la réduction du nombre de feuilles de calcul, etc.
Convertissez des PDF en présentations PowerPoint
// Include the required Java and Aspose.PDF for PHP libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF for PHP library
use com\aspose\pdf\Document;
use com\aspose\pdf\PptxSaveOptions;
use com\aspose\pdf\License;
// Set the path to the Aspose.PDF license file
$license = "Aspose.PDF.PHPviaJava.lic";
// Create a new License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense($license);
// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
// Set the path to the output PPTX file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . "results" . DIRECTORY_SEPARATOR . 'sample.pptx';
// Load the input PDF document
$document = new Document($inputFile);
// Create an instance of PptxSaveOptions
$saveOption = new PptxSaveOptions();
// Save the PDF document as a PPTX file
$document->save($outputFile, $saveOption);
L’API PHP prend en charge la conversion de pages PDF en diapositives de présentation PowerPoint avec du texte ou des images sélectionnables en rendant les diapositives sous forme d’images. Le schéma d’enregistrement du format de document portable dans PowerPoint est presque le même. Chargez le fichier à l’aide de la classe Document, puis appelez la méthode Save avec le chemin du fichier de sortie et SaveFormat comme paramètres. En cas de rendu avec des options de présentation spéciales, les programmeurs peuvent utiliser la classe PPTxSaveOptions avec toutes les options de rendu spécifiques pertinentes. Appel de la méthode save et transmission des options en paramètre.
Conversion de PDF en HTML
// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF library
use com\aspose\pdf\Document;
use com\aspose\pdf\HtmlSaveOptions;
use com\aspose\pdf\License;
// Set the path to the license file
$licensePath = "Aspose.PDF.PHPviaJava.lic";
// Create a new License object and set the license using the provided file path
$license = new License();
$license->setLicense($licensePath);
// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
// Set the path to the output HTML file
$outputFile = $dataDir . DIRECTORY_SEPARATOR . 'pdf-to-html.html';
// Create a new Document object and load the input PDF file
$document = new Document($inputFile);
// Create a new HtmlSaveOptions object for saving the document as HTML
$saveOption = new HtmlSaveOptions();
// Save the document as HTML using the specified save options
$document->save($outputFile, $saveOption);
PDF Parsing Library prend en charge l’enregistrement de PDF au format HTML dans son ensemble ainsi qu’avec des ressources intégrées, y compris des images. La procédure de conversion est la même que celle du PDF vers d’autres formats pour des cas génériques, tels que le chargement du document source et l’appel de la méthode Save avec le chemin du fichier HTML de sortie et SaveFormat.Html comme paramètres. En cas d’enregistrement avec des ressources intégrées, il existe une classe HTMLSaveOptions proposant plusieurs options, telles que l’enregistrement des images dans un dossier spécifique pendant la conversion, la division du code HTML résultant en plusieurs pages, etc.
Convertir un PDF en images
// Include the required libraries
require_once ("java/Java.inc");
require_once ("lib/aspose.pdf.php");
// Import the necessary classes from the Aspose.PDF for PHP via Java library
use com\aspose\pdf\Document;
use com\aspose\pdf\devices_Resolution;
use com\aspose\pdf\devices_JpegDevice;
use com\aspose\pdf\License;
// Create a License object and set the license file
$licenceObject = new License();
$licenceObject->setLicense("Aspose.PDF.PHPviaJava.lic");
// Set the path to the input PDF file
$dataDir = getcwd() . DIRECTORY_SEPARATOR . "samples";
$inputFile = $dataDir . DIRECTORY_SEPARATOR . "sample.pdf";
// Set the path and template for the output JPEG files
$imageFileNameTemplate = $dataDir . DIRECTORY_SEPARATOR . 'pdf-to-jpeg-';
// Open the target document
$document = new Document($inputFile);
$pages = $document->getPages();
$count = $pages->size();
// Create a Resolution object with a resolution of 300 dpi
$resolution = new devices_Resolution(300);
// Create a JpegDevice object with the specified resolution
$imageDevice = new devices_JpegDevice($resolution);
// Loop through each page of the document
for ($pageCount = 1; $pageCount <= $document->getPages()->size(); $pageCount++) {
// Convert a particular page and save the image to a file
$imageFileName = $imageFileNameTemplate . $pageCount . '.jpg';
$page = $document->getPages()->get_Item($pageCount);
$imageDevice->process($page, $imageFileName);
}
La conversion de pages PDF en images, notamment PNG, JPEG, TIFF, BMP, etc. est facile dans les applications basées sur Java à l’aide des extraits de code répertoriés ci-dessous. Les développeurs peuvent parcourir les pages PDF en boucle après avoir chargé le fichier et convertir page par page au format d’image requis. Les développeurs peuvent définir la résolution horizontale et verticale des images à l’aide de Resolution class