Extrahieren Sie Text aus PDF in JavaScript

So extrahieren Sie Text aus PDF mithilfe der Node.js via C++ -Bibliothek

So extrahieren Sie Text aus PDF mithilfe der Node.js via C++ -Bibliothek

Um eine Text-PDF-Datei zu extrahieren, verwenden wir die API Aspose.PDF for .NET, eine funktionsreiche, leistungsstarke und benutzerfreundliche API zur Dokumentenbearbeitung für die Plattform nodejs-cpp. Öffnen Sie den Paketmanager von NuGet, suchen Sie nachAspose.pdf und installieren Sie ihn. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.

Extrahieren Sie Text aus PDF in JavaScript


Sie benötigen Aspose.PDF library, um den Code in Ihrer Umgebung auszuprobieren.

  1. Laden Sie das PDF mit einer Instanz von Document.
  2. Erstellen Sie ein TextAbsorber-Objekt, um Text zu extrahieren.
  3. Akzeptiere den Absorber für alle Seiten.
  4. Holen Sie sich den extrahierten Text
  5. Erstellen Sie einen Writer und öffnen Sie die Datei, schreiben Sie eine Textzeile in die Datei

Text aus PDF extrahieren - JavaScript

Dieser Beispielcode zeigt, wie Text aus PDF-Dokumenten extrahiert wird

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Informationen zu Aspose.PDF für die Node.js via C++ API

Unsere .NET-Bibliothek kann ein Dokument aus jedem unterstützten Download-Format mit jedem unterstützten Speicherformat kombinieren. Aspose.PDF für .NET-Bibliothek bietet ziemlich universelle Lösungen, mit denen Sie die Aufgaben beim Zusammenführen von Dokumenten lösen können. Aspose.PDF unterstützt die meisten gängigen Dokumentformate, sowohl zum Laden als auch zum Speichern. Machen Sie darauf aufmerksam, dass der aktuelle Abschnitt nur beliebte Zusammenführungen beschreibt. Die aktuelle Seite enthält Informationen zum Zusammenführen von TEXT zu {{FILERESULT}}. Es gibt jedoch viele Kombinationen zum Zusammenführen Ihrer Dateien. Eine vollständige Liste der unterstützten Formate finden Sie im Abschnitt Unterstützte Dateiformate.