Wyodrębnij tekst z pliku PDF w JavaScript

Jak wyodrębnić tekst z pliku PDF przy użyciu biblioteki Node.js via C++

Jak wyodrębnić tekst z pliku PDF przy użyciu biblioteki Node.js via C++

Aby wyodrębnić plik tekstowy PDF, użyjemy interfejsu API Aspose.PDF for .NET, który jest bogatym w funkcje, wydajnym i łatwym w użyciu interfejsem API manipulacji dokumentami dla platformy nodejs-cpp. Otwórz menedżera pakietów NuGet, wyszukaj Aspose.pdf i zainstaluj. Możesz także użyć następującego polecenia z konsoli Menedżera pakietów.

Wyodrębnij tekst z pliku PDF w JavaScript


Potrzebujesz Aspose.PDF library, aby wypróbować kod w swoim środowisku.

  1. Załaduj plik PDF z instancją dokumentu.
  2. Utwórz obiekt TextTabSorber, aby wyodrębnić tekst.
  3. Zaakceptuj absorber dla wszystkich stron.
  4. Pobierz wyodrębniony tekst
  5. Utwórz pisarza i otwórz plik, napisz wiersz tekstu do pliku

Wyodrębnij tekst z PDF - JavaScript

Ten przykładowy kod pokazuje, jak wyodrębnić tekst z dokumentów PDF

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Informacje o Aspose.PDF dla Node.js via C++ API

Nasza biblioteka.NET może łączyć dokument z dowolnego obsługiwanego formatu pobierania z dowolnym obsługiwanym formatem zapisu. Aspose.PDF dla biblioteki.NET zapewnia dość uniwersalne rozwiązania, które pomogą Ci rozwiązać zadania łączenia dokumentów. Aspose.PDF obsługuje największą liczbę popularnych formatów dokumentów, zarówno do ładowania, jak i zapisywania. Zwróć uwagę, że bieżąca sekcja opisuje tylko popularne scalanie. Bieżąca strona zawiera informacje o scaleniu TEXT z {{FILERESULT}}. Istnieje jednak wiele kombinacji do scalania plików. Pełną listę obsługiwanych formatów można znaleźć w sekcji Obsługiwane formaty plików.