Extraer texto de un PDF en PHP

Cómo extraer texto de un PDF con PHP via Java

Cómo extraer texto de un PDF con Aspose.PDF para PHP via Java

Para extraer un archivo PDF de texto, utilizaremos la API Aspose.PDF for.NET, que es una API de manipulación de documentos potente, fácil de usar y rica en funciones para la plataforma php-java. Abre el administrador de paquetes NuGet, busca Aspose.pdf e instálalo. También puede usar el siguiente comando desde la consola del administrador de paquetes.

Extraer texto de un PDF en PHP


Necesita biblioteca Aspose.PDF para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Crea un objeto TextAbsorber para extraer texto.
  3. Acepta el absorbente para todas las páginas.
  4. Obtenga el texto extraído
  5. Crea un escritor y abre el archivo, escribe una línea de texto en el archivo

Extrae texto de un PDF con PHP

Este código de ejemplo muestra cómo extraer texto de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Acerca de Aspose.PDF for la API de PHP

Nuestra biblioteca.NET puede combinar un documento de cualquier formato de descarga compatible con cualquier formato de guardado compatible. La biblioteca Aspose.PDF for .NET ofrece soluciones bastante universales que le ayudarán a resolver las tareas de combinación de documentos. Aspose.PDF admite la mayor cantidad de formatos de documentos populares, tanto para cargar como para guardar. Preste atención al hecho de que en la sección actual solo se describen las combinaciones populares. La página actual proporciona información sobre la fusión de TEXT con {{FILERESULT}}. Sin embargo, hay muchas combinaciones para combinar los archivos. Para obtener una lista completa de los formatos compatibles, consulte la sección Formatos de archivo compatibles.