Wyodrębnij PDF przez PHP

Jak wyodrębnić tekst i obrazy z pliku PDF za pomocą biblioteki PHP via Java

Najpopularniejsza akcja z Parser

Jak analizować plik PDF za pomocą biblioteki PHP via Java

Aby wyodrębnić pliki PDF, użyjemy interfejsu API Aspose.PDF for .NET, który jest bogatym w funkcje, potężnym i łatwym w użyciu interfejsem API do manipulacji dokumentami dla platformy php-java. Otwórz menedżera pakietów NuGet, wyszukaj Aspose.pdf i zainstaluj. Można również użyć następującego polecenia z konsoli Menedżera pakietów.

Analizuj PDF przez PHP


Potrzebujesz Aspose.PDF library, aby wypróbować kod w swoim środowisku.

  1. Załaduj plik PDF z instancją dokumentu.
  2. Utwórz obiekt TextAbsorber, aby wyodrębnić tekst.
  3. Zaakceptuj absorber dla wszystkich stron.
  4. Pobierz wyodrębniony tekst
  5. Utwórz pisarza i otwórz plik, napisz wiersz tekstu do pliku

Wyodrębnij pliki PDF - PHP

Ten przykładowy kod pokazuje, jak wyodrębnić dokumenty PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Informacje o Aspose.PDF for PHP via Java API

Nasza Biblioteka.NET może łączyć dokument z dowolnego obsługiwanego formatu pobierania z dowolnym obsługiwanym formatem zapisu. Aspose.PDF dla biblioteki.NET zapewnia dość uniwersalne rozwiązania, które pomogą Ci rozwiązać zadania scalania dokumentów. Aspose.PDF obsługuje największą liczbę popularnych formatów dokumentów, zarówno do ładowania, jak i zapisywania. Zwróć uwagę na fakt, że obecna sekcja opisuje tylko popularne połączenia. Bieżąca strona zawiera informacje o scalaniu {{FILETYPE}} z {{FILERESSULT}}. Istnieje jednak wiele kombinacji do łączenia plików. Pełną listę obsługiwanych formatów można znaleźć w sekcji Obsługiwane formaty plików.