Estrai testo da PDF in PHP

Come estrarre testo da PDF utilizzando PHP via Java

Come estrarre testo da PDF utilizzando Aspose.PDF per PHP via Java

Per estrarre un file PDF di testo, utilizzeremo l’API Aspose.PDF for .NET che è un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per la piattaforma php-java. Apri il gestore di pacchetti NuGet, cerca Aspose.pdf e installa. Puoi anche usare il seguente comando dalla console di Package Manager.

Estrai testo da PDF in PHP


È necessaria libreria Aspose.PDF per provare il codice nel proprio ambiente.

  1. Carica il PDF con un’istanza di Document.
  2. Crea un oggetto TextAbsorber per estrarre il testo.
  3. Accetta l’assorbitore per tutte le pagine.
  4. Recupera il testo estratto
  5. Crea uno scrittore e apri il file, scrivi una riga di testo nel file

Estrai testo da PDF con PHP

Questo codice di esempio mostra come estrarre testo da documenti PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Informazioni sull'API Aspose.PDF for PHP via Java

La nostra libreria .NET può combinare un documento da qualsiasi formato di download supportato a qualsiasi formato di salvataggio supportato. La libreria Aspose.PDF for .NET offre soluzioni abbastanza universali che ti aiuteranno a risolvere le attività di unione dei documenti. Aspose.PDF supporta il numero più significativo di formati di documenti più diffusi, sia per il caricamento che per il salvataggio. Attira la tua attenzione sul fatto che la sezione corrente descrive solo le unioni più diffuse. La pagina corrente fornisce informazioni sull’unione di TEXT con {{FILERESULT}}. Tuttavia, ci sono molte combinazioni per unire i file. Per un elenco completo dei formati supportati, consulta la sezione Formati di file supportati.