Извлеките PDF-файл с помощью PHP

Как извлечь текст и изображения из PDF с помощью библиотеки PHP via Java

Самый популярный экшен с Parser

Как анализировать PDF-файлы с помощью библиотеки PHP via Java

Для извлечения PDF-файлов мы будем использовать API Aspose.PDF for .NET, который представляет собой многофункциональный, мощный и простой в использовании API для работы с документами для платформы php-java. Откройте диспетчер пакетов NuGet, найдите aSpose.pdf и установите. Вы также можете использовать следующую команду в консоли диспетчера пакетов.

Анализ PDF с помощью PHP


Вам нужна библиотека Aspose.PDF, чтобы попробовать код в своей среде.

  1. Загрузите PDF-файл вместе с экземпляром документа.
  2. Создайте объект TextAbsorber для извлечения текста.
  3. Примите абсорбер для всех страниц.
  4. Получите извлеченный текст
  5. Создайте устройство записи и откройте файл, запишите в файл строку текста

Извлечение PDF-файлов - PHP

В этом примере кода показано, как извлекать PDF-документы

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Об API Aspose.PDF for PHP via Java

Наша библиотека.NET может объединить документ из любого поддерживаемого формата загрузки в любой поддерживаемый формат сохранения. Библиотека Aspose.PDF для .NET предоставляет довольно универсальные решения, которые помогут вам решить задачи объединения документов. Aspose.PDF поддерживает самое значительное количество популярных форматов документов, как для загрузки, так и для сохранения. Обращаем ваше внимание на то, что в данном разделе описаны только популярные слияния. На текущей странице представлена информация о слиянии {{FILETYPE}} с {{FILERESULT}}. Однако существует множество комбинаций для объединения файлов. Полный список поддерживаемых форматов см. в разделе Поддерживаемые форматы файлов.