Извлечь текст из PDF в JavaScript

Как извлечь текст из PDF с помощью библиотеки JavaScript via C++

Как извлечь текст из PDF с помощью библиотеки JavaScript via C++

Вам нужно извлечь текст из PDF? Программа Aspose.PDF для JavaScript через C++ помогает извлекать текст из PDF-документа. Для извлечения данных мы воспользуемся простым и безопасным набором инструментов Aspose.PDF для JavaScript через C++, который используется для работы с PDF непосредственно в веб-браузере. Чтобы установить и использовать Aspose.PDF для JavaScript через C++, извлеките файлы из архива ZIP.

Извлечь текст из PDF в JavaScript


Чтобы попробовать код в своей среде, вам понадобится Aspose.PDF для JavaScript через C++.

  1. Загрузите PDF-файл вместе с экземпляром документа.
  2. Создайте объект TextAbsorber для извлечения текста.
  3. Примите абсорбер для всех страниц.
  4. Получите извлеченный текст
  5. Создайте писателя и откройте файл, напишите в файл строку текста

Извлечь текст из PDF - JavaScript

В этом примере кода показано, как извлекать текст из PDF-документов

Input file:

File not added

Output format:

PDF

Output file:


    var ffileExtract = function (e) {
        const file_reader = new FileReader();
        file_reader.onload = (event) => {
        /*Extract text from a PDF-file*/
        const json = AsposePdfExtractText(event.target.result, e.target.files[0].name);
        if (json.errorCode == 0) document.getElementById('output').textContent = json.extractText;
        else document.getElementById('output').textContent = json.errorText;
        };
        file_reader.readAsArrayBuffer(e.target.files[0]);
    };

О Aspose.PDF для API JavaScript via C++

Aspose.PDF для JavaScript через C++ позволяет разработчикам манипулировать PDF-файлами непосредственно в Интернете. Это решение JavaScript построено на использовании технологии WebAssembly и основано на Aspose.PDF for .NET Lightweight. Вы можете легко использовать aspose-pdf для JavaScript на языке C++, а затем следовать инструкциям по установке. Aspose.PDF для JavaScript поддерживает широкий спектр функций, таких как:

  • Оптимизируйте PDF-документ.
  • Добавьте штамп в PDF-файл.
  • Объедините PDF-файлы.
  • Разделите PDF на два файла.
  • Конвертируйте PDF в форматы DOCX, XLSX, JPEG, PNG, TIFF, BMP, SVG, SVG (ZIP), XPS, TXT и т. д.

Дополнительную информацию о Aspose.PDF для JavaScript с помощью C++ API можно найти в нашей документации по использованию API.