Extraire du texte d’un PDF en Go

Comment extraire du texte d’un PDF à l’aide de Go via C++

Comment extraire du texte d'un PDF à l'aide de Aspose.PDF pour Go via C++

Avez-vous besoin d’analyser un PDF ? Le fichier Aspose.PDF pour Go via C++ permet d’extraire du texte à partir de documents PDF. Pour effectuer l’extraction, nous utiliserons Aspose.PDF for Go via C++, une boîte à outils simple et sécurisée utilisée pour travailler avec des fichiers PDF. Pour installer et utiliser Aspose.PDF pour Go via C++, cliquez sur Télécharger Aspose.PDF pour Go.

Extraire du texte d’un PDF en Go


Vous avez besoin de Aspose.PDF for Go via C++ pour essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Créez un objet TextAbsorber pour extraire du texte.
  3. Acceptez l’absorbeur pour toutes les pages.
  4. Obtenir le texte extrait
  5. Créez un rédacteur et ouvrez le fichier, écrivez une ligne de texte dans le fichier

Extraire du texte d'un PDF avec Go

Cet exemple de code montre comment extraire du texte à partir de documents PDF

Input file:

File not added

Output format:

PDF

Output file:


    package main

    import "github.com/aspose-pdf/aspose-pdf-go-cpp"
    import "log"
    import "fmt"

    func main() {
        // Open(filename string) opens a PDF-document with filename
        pdf, err := asposepdf.Open("sample.pdf")
        if err != nil {
            log.Fatal(err)

        }
        // ExtractText() returns PDF-document contents as plain text
        txt, err := pdf.ExtractText()
        if err != nil {
            log.Fatal(err)
        }
        // Print
        fmt.Println("Extracted text:\n", txt)
        // Close() releases allocated resources for PDF-document
        defer pdf.Close()
    }

À propos de Aspose.PDF pour l'API Aspose.PDF for Go via C++

Notre bibliothèque .NET peut combiner un document de n’importe quel format de téléchargement pris en charge vers n’importe quel format de sauvegarde pris en charge. La bibliothèque Aspose.PDF pour .NET fournit des solutions assez universelles qui vous aideront à résoudre les tâches de fusion de documents. Aspose.PDF prend en charge le plus grand nombre de formats de documents courants, tant pour le chargement que pour l’enregistrement. Attirez votre attention sur le fait que la section actuelle ne décrit que les fusions populaires. La page actuelle fournit des informations sur la fusion de TEXT avec {{FILERESULT}}. Cependant, il existe de nombreuses combinaisons pour fusionner vos fichiers. Pour une liste complète des formats pris en charge, consultez la section Formats de fichier pris en charge.