Извлечь текст из PDF в PHP

Как извлечь текст из PDF с помощью PHP via Java

Как извлечь текст из PDF с помощью файла Aspose.PDF для PHP via Java

Чтобы извлечь текстовый PDF-файл, мы будем использовать API Aspose.PDF for .NET, который представляет собой многофункциональный, мощный и простой в использовании API для работы с документами для платформы php-java. Откройте менеджер пакетов NuGet, найдите Aspose.pdf и установите. Вы также можете использовать следующую команду в консоли диспетчера пакетов.

Извлечь текст из PDF в PHP


Чтобы попробовать код в своей среде, вам понадобится библиотека Aspose.PDF.

  1. Загрузите PDF-файл вместе с экземпляром документа.
  2. Создайте объект TextAbsorber для извлечения текста.
  3. Примите абсорбер для всех страниц.
  4. Получите извлеченный текст
  5. Создайте писателя и откройте файл, напишите в файл строку текста

Извлеките текст из PDF с помощью PHP

В этом примере кода показано, как извлекать текст из PDF-документов

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Об API Aspose.PDF for PHP via Java

Наша библиотека.NET может объединить документ из любого поддерживаемого формата загрузки в любой поддерживаемый формат сохранения. Библиотека Aspose.PDF для .NET предоставляет довольно универсальные решения, которые помогут вам решить задачи объединения документов. Aspose.PDF поддерживает самое значительное количество популярных форматов документов, как для загрузки, так и для сохранения. Обращаем ваше внимание на то, что в данном разделе описаны только популярные слияния. На текущей странице представлена информация о слиянии TEXT с {{FILERESULT}}. Однако существует множество комбинаций для объединения файлов. Полный список поддерживаемых форматов см. в разделе Поддерживаемые форматы файлов.