Wyodrębnij tekst z pliku PDF w PHP

Jak wyodrębnić tekst z pliku PDF za pomocą PHP via Java

Jak wyodrębnić tekst z pliku PDF za pomocą Aspose.PDF dla PHP via Java

Aby wyodrębnić plik tekstowy PDF, użyjemy interfejsu API Aspose.PDF for .NET, który jest bogatym w funkcje, wydajnym i łatwym w użyciu interfejsem API manipulacji dokumentami dla platformy php-java. Otwórz menedżera pakietów NuGet, wyszukaj Aspose.pdf i zainstaluj. Możesz także użyć następującego polecenia z konsoli Menedżera pakietów.

Wyodrębnij tekst z pliku PDF w PHP


Potrzebujesz Aspose.PDF library, aby wypróbować kod w swoim środowisku.

  1. Załaduj plik PDF z instancją dokumentu.
  2. Utwórz obiekt TextTabSorber, aby wyodrębnić tekst.
  3. Zaakceptuj absorber dla wszystkich stron.
  4. Pobierz wyodrębniony tekst
  5. Utwórz pisarza i otwórz plik, napisz wiersz tekstu do pliku

Wyodrębnij tekst z pliku PDF za pomocą PHP

Ten przykładowy kod pokazuje, jak wyodrębnić tekst z dokumentów PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Informacje o Aspose.PDF for PHP via Java API

Nasza Biblioteka.NET może łączyć dokument z dowolnego obsługiwanego formatu pobierania z dowolnym obsługiwanym formatem zapisu. Aspose.PDF dla biblioteki.NET zapewnia dość uniwersalne rozwiązania, które pomogą Ci rozwiązać zadania scalania dokumentów. Aspose.PDF obsługuje największą liczbę popularnych formatów dokumentów, zarówno do ładowania, jak i zapisywania. Zwróć uwagę na fakt, że obecna sekcja opisuje tylko popularne połączenia. Bieżąca strona zawiera informacje o scalaniu TEXT z {{FILERESSULT}}. Istnieje jednak wiele kombinacji do łączenia plików. Pełną listę obsługiwanych formatów można znaleźć w sekcji Obsługiwane formaty plików.