Extrahieren Sie Text aus PDF in JavaScript
So extrahieren Sie Text aus PDF mithilfe der Node.js via C++ -Bibliothek
So extrahieren Sie Text aus PDF mithilfe der Node.js via C++ -Bibliothek
Um eine Text-PDF-Datei zu extrahieren, verwenden wir die API Aspose.PDF for .NET, eine funktionsreiche, leistungsstarke und benutzerfreundliche API zur Dokumentenbearbeitung für die Plattform nodejs-cpp. Öffnen Sie den Paketmanager von NuGet, suchen Sie nachAspose.pdf und installieren Sie ihn. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.
Extrahieren Sie Text aus PDF in JavaScript
Sie benötigen Aspose.PDF library, um den Code in Ihrer Umgebung auszuprobieren.
- Laden Sie das PDF mit einer Instanz von Document.
- Erstellen Sie ein TextAbsorber-Objekt, um Text zu extrahieren.
- Akzeptiere den Absorber für alle Seiten.
- Holen Sie sich den extrahierten Text
- Erstellen Sie einen Writer und öffnen Sie die Datei, schreiben Sie eine Textzeile in die Datei
Text aus PDF extrahieren - JavaScript
Dieser Beispielcode zeigt, wie Text aus PDF-Dokumenten extrahiert wird
Input file:
File not added
Output format:
Output file: