Extrahieren Sie Text aus PDF in JavaScript

So extrahieren Sie Text aus PDF mithilfe der Node.js via C++ -Bibliothek

So extrahieren Sie Text aus PDF mithilfe der Node.js via C++ -Bibliothek

Müssen Sie Text aus PDF extrahieren? Die Datei Aspose.PDF für Node.js über C++ hilft beim Extrahieren von Text aus einem PDF-Dokument. Um PDF zu analysieren, verwenden wir Aspose.PDF for Node.js via C++, ein einfaches und sicheres Toolkit, das für die Arbeit mit PDF verwendet wird. Um Aspose.PDF für Node.js über C++ zu installieren und zu verwenden, extrahieren Sie Dateien aus dem ZIP-Archiv.

Extrahieren Sie Text aus PDF in JavaScript


Sie benötigen Aspose.PDF für Node.js über C++, um den Code in Ihrer Umgebung auszuprobieren.

  1. Laden Sie das PDF mit einer Instanz von Document.
  2. Erstellen Sie ein TextAbsorber-Objekt, um Text zu extrahieren.
  3. Akzeptiere den Absorber für alle Seiten.
  4. Holen Sie sich den extrahierten Text
  5. Erstellen Sie einen Writer und öffnen Sie die Datei, schreiben Sie eine Textzeile in die Datei

Text aus PDF extrahieren - JavaScript

Dieser Beispielcode zeigt, wie Text aus PDF-Dokumenten extrahiert wird

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Informationen zu Aspose.PDF für die Node.js via C++ API

Aspose.PDF für Node.js über C++ ermöglicht es Entwicklern, PDF-Dateien zu manipulieren. Diese JavaScript-Lösung basiert auf der Verwendung der WebAssembly-Technologie und basiert auf Aspose.PDF für C++. Sie können Aspose.Pdf ganz einfach über C++ für Node.js verwenden und dann den Installationsanweisungen folgen. Die Aspose.PDF für Node.js unterstützt eine Vielzahl von Funktionen wie:

  • Optimieren Sie das PDF-Dokument.
  • Fügen Sie der PDF-Datei einen Stempel hinzu.
  • PDF-Dateien zusammenführen.
  • PDF in zwei Dateien aufteilen.
  • PDF in DOCX, XLSX, JPEG, PNG, TIFF, BMP, SVG, SVG (ZIP), XPS, TXT usw. konvertieren

Weitere Informationen zu Aspose.PDF für Node.js über die C++-API finden Sie in unserer Dokumentation zur Verwendung der API.