Извлечь текст из PDF в JavaScript
Как извлечь текст из PDF с помощью библиотеки Node.js via C++
Как извлечь текст из PDF с помощью библиотеки Node.js via C++
Чтобы извлечь текстовый PDF-файл, мы будем использовать API Aspose.PDF for .NET, который представляет собой многофункциональный, мощный и простой в использовании API для работы с документами для платформы nodejs-cpp. Откройте менеджер пакетов NuGet, найдите Aspose.pdf и установите. Вы также можете использовать следующую команду в консоли диспетчера пакетов.
Извлечь текст из PDF в JavaScript
Чтобы попробовать код в своей среде, вам понадобится библиотека Aspose.PDF.
- Загрузите PDF-файл вместе с экземпляром документа.
- Создайте объект TextAbsorber для извлечения текста.
- Примите абсорбер для всех страниц.
- Получите извлеченный текст
- Создайте писателя и откройте файл, напишите в файл строку текста
Извлечь текст из PDF - JavaScript
В этом примере кода показано, как извлекать текст из PDF-документов
Input file:
File not added
Output format:
Output file: